数式で独楽する

数式を使って楽しむブログです

[tex: ]

二項分布

二項分布

「二項分布」とは、結果が成功か失敗となる試行を反復したときの、成功の回数の分布をいいます。
例えば、

  • 硬貨を反復して投げたときに表が出る回数
  • サイコロを反復して投げたときに1の目が出る回数

などは二項分布に従います。

1回の試行での成功の確率を$p$、反復の回数を$n$としたとき、試行が$k\, (= 0,1,2,\cdots , n)$回成功する確率は、
\begin{equation}
P(X=k) = {}_n C_k \, p^k q^{n -k} = \frac{n!}{k! (n -k)!} \, p^k q^{n -k} \quad (p+q=1) \tag{1}
\end{equation}となります。*1
このとき、成功の回数となる確率変数$X$は二項分布 B(n,p)に従う、といいます。

確率の和

確率の和は1です。
つまり
\begin{equation}
\sum_{k=0}^n P(X=k) = \sum_{k=0}^n {}_n C_k \, p^k q^{n -k} =1 \tag{2}
\end{equation}です。
これは、二項定理
二項定理 - 数式で独楽する
\begin{equation}
(p +q)^n = \sum_{k=0}^n {}_n C_k \, p^k q^{n -k}
\end{equation}で$p+q=1$とすればたちどころに得ることができます。

平均

平均は$np$です。
そのままでは導くことは難しそうです。
組合せの定義に戻って計算していきます。
順列・組合せ - 数式で独楽する
\begin{eqnarray}
k \, {}_n C_k \, p^k q^{n -k} &=& k \cdot \frac{n!}{k! (n -k)!} \, p^k q^{n -k} \\
&=& \frac{n!}{(k -1)! (n -k)!} \, p^k q^{n -k} \\
&=& n \cdot \frac{(n -1)!}{(k -1)! (n -k)!} \, p^k q^{n -k} \\
&=& np \cdot \frac{(n -1)!}{(k -1)! \left \{ (n -1)-(k -1) \right \} !} \, p^{k -1} q^{(n -1) - (k -1)} \\
&=& np \, {}_{n -1} C_{k -1} \, p^{k -1} q^{(n -1)-(k -1)} \tag{3}
\end{eqnarray}
式(3)で$k=0,1,2, \cdots, n -1,n$とし、辺々相加えると、
\begin{equation}
\sum_{k=0}^n k \, {}_n C_k p^k q^{n -k} = np \sum_{k=0}^{n -1} {}_{n -1} C_{k -1} \, p^{k -1} q^{(n -1)-(k -1)} \tag{4}
\end{equation}となります。
ここで、式(4)の左辺は
\begin{eqnarray}
E(X) &=& \sum_{k=0}^n k \, P(X=k) \\
&=& \sum_{k=0}^n k \, {}_n C_k p^k q^{n -k} \\
\end{eqnarray}で、右辺は式(2)により
\begin{equation}
np \sum_{k=0}^{n -1} {}_{n -1} C_{k -1} \, p^{k -1} q^{(n -1)-(k -1)} = np
\end{equation}なので、
\begin{equation}
E(X) = np
\end{equation}を得ます。

分散と標準偏差

分散$V(X)=\sigma^2$と標準偏差$\sigma$は、
\begin{eqnarray}
V(X) = \sigma^2 &=& npq = np(1-p) \\
\sigma &=& \sqrt{npq} = \sqrt{np(1-p)}
\end{eqnarray}
です。

平均のときと同様にしていきます。式(3)を何回か用います。
\begin{eqnarray}
k^2 \, {}_n C_k p^k q^{n -k} &=& npk \, {}_{n -1} C_{k -1} p^{k -1} q^{(n -1)-(k -1)} \\
&=& np(k -1) \, {}_{n -1} C_{k -1} p^{k -1} q^{(n -1)-(k -1)} + np \, {}_{n -1} C_{k -1} p^{k -1} q^{(n -1)-(k -1)} \\
&=& n(n -1)p^2 \, {}_{n -2} C_{k -2} p^{k -2} q^{(n -2)-(k -2)} + np \, {}_{n -1} C_{k -1} p^{k -1} q^{(n -1)-(k -1)}
\end{eqnarray}
ここで$k=0,1,2, \cdots , n$とし、辺々相加えます。式(2)を用いて、
\begin{eqnarray}
E(X^2) = \sum_{k=0}^n k^2 \, {}_n C_k \, p^k q^{n -k} &=& n(n -1)p^2 + np \\
&=& (n^2 -n)p^2 + np
\end{eqnarray}を得ます。

これより、分散は
\begin{eqnarray}
V(X) = \sigma^2 &=& E(X^2) - \left( E(X) \right)^2 \\
&=& (n^2 -n)p^2 +np - n^2 p^2 \\
&=& n(p -p^2) \\
&=& np(1 -p) = npq
\end{eqnarray}
となります。

標準偏差は
\begin{equation}
\sigma = \sqrt{npq} = \sqrt{np(1 -p)}
\end{equation}
となります。
f:id:toy1972:20200920214815p:plain:w400

*1:$n$回の試行のうち、成功となる$k$回の選び方は \begin{equation} {}_n P_k = n(n -1)\cdots (n -k+1) = \frac{n!}{(n -k)!} \end{equation}通りですが、順序は問われないので、 \begin{equation} {}_n C_k = \frac{n!}{k! (n -k)!} \end{equation}通りです。