離散型確率変数が従う確率分布の代表例として二項分布が知られている.
二項分布の使い所としては, 「Yes」か「No」のどちらかが確率的に起きるような事象の予測である. すなわち, 「Yes」が起きる確率を \( p \) , 「No」が起きる確率を \( q \) として, \[p + q = 1 \notag \] を満たすような試行を何度も繰り返したときの期待値や分散の予測に用いられる.
例えば, 表がでる確率 \( p \) が \[p=\frac{2}{5} \notag \] 裏がでる確率 \( q \) が \[q=1-p =\frac{3}{5} \notag \] のコイン投げを10回繰り返したとき, 表(もしくは裏)が何度あらわれるのかなどは典型的な二項分布の問題の例である.
二項分布は, 二項展開の公式 \[ \qty( a+b )^{n} = \sum_{k=0}^{n}{}_{n}C_{k}a^{k}b^{n-k}\] で登場する二項係数 \[ {}_{n}C_{k} \coloneqq \frac{n ! }{k ! \qty( n – k ) ! } \] が登場することからこの名前がついている.
二項分布
さて, 1回の試行で「Yes」がでる確率が \( p \) である事象を \( n \) 回繰り返す中で「Yes」が起きる回数を(離散型)確率変数 \( X \) とする. このような試行の結果, ちょうど \( k \) 回「Yes」がでる確率, すなわち \( X=k \) となる確率 \( P(X=k) \) は次式によって与えられる. \[\begin{aligned} P(X=k) &= \frac{n ! }{k ! \qty( n – k ) ! }p^{k }\qty( 1-p )^{n-k } \\ &= \frac{n ! }{k ! \qty( n – k ) ! }p^{k }q^{n-k } \quad . \end{aligned}\] ここで, 二項係数 \[{}_{n}C_{k} =\frac{n ! }{k ! \qty( n – k ) ! } \notag \] を用いると, 確率 \( P(X=k) \) は \[P(X=k) = {}_{n}C_{k} p^{k }q^{n-k } \label{bP}\] と書くことができる.
この離散型確率変数 \( X \) が式\eqref{bP}にしたがう確率分布のことを二項分布といい, 記号 \( B\qty( n ,p ) \) であらわされる.
二項分布の確率変数は記号 \( k \) か \( r \) が用いられることが多く, このページでも確率変数を記号 \( X \) の代わりに \( k \) を用いることにする.
二項分布の規格化
二項分布 \( B\qty( n, p ) \) の確率分布 \[f(x_{i}) = {}_{n}C_{x_{i}} p^{x_{i} }q^{n-k } \notag \] が, 確率分布が満たすべき規格化条件の式 \[\sum_{i} f(x_{i}) = 1 \label{pnat2}\] を満たしていることを示しておこう. ここで \( \sum_{i} \) は取り得る \( x_{i} \) の値すべてについて和を取ることを意味している.
今の場合, \( B\qty( n, p ) \) は \( n \) 回の試行を行うので, 確率変数 \( k = x_{i} \) が取り得る値というのは, \( x_{1}=0, x_{2}=1, x_{3}=2, \cdots , x_{n+1}=n \) といった値を取り得る. したがって, \[\begin{aligned} \sum_{i}^{} f(x_{i}) &= \sum_{i=1}^{n+1} {}_{n}C_{x_{i}} p^{x_{i} }q^{n-x_{i} } \\ &= \sum_{k=0}^{n} {}_{n}C_{k} p^{k }q^{n-k } \\ &= \qty( p + q )^{n} \\ &= \qty( 1 )^{n} = 1 \end{aligned}\] となり, 二項分布は規格化条件の式\eqref{pnat2}を満たしていることがわかる[1]途中, 二項展開の公式 \[ \qty( a+b )^{n} = \sum_{k=0}^{n}{}_{n}C_{k}a^{k}b^{n-k}\] を用いた..
二項分布の性質
証明は後に回して, 二項分布 \( B(n,p) \) の期待値 \( \mu \) と分散 \( V \) , 標準偏差 \( \sigma \) はそれぞれ次のように与えられる. \[\mu = np\] \[\sigma^2 = V = np\qty( 1 – p ) \] これらの結論から導き出される二項分布の特徴として, 次のようなものがあげられる.
いま, 「Yes」がでる確率 \( p \) が \( p=\frac{1}{2} \) のとき, \( n \) 回の独立試行に対する二項分布の期待値 \( \mu \) は \[\mu = \frac{n}{2} \notag \] である. さらにこのとき, \[\begin{aligned} P(X=k) & = {}_{n}C_{k}p^{k}(1-p)^{n-k} \\ & = {}_{n}C_{k}\qty( \frac{1}{2} )^{k} \qty( \frac{1}{2} )^{n-k} \\ & = {}_{n}C_{k}\qty( \frac{1}{2} )^{n} \end{aligned}\] \[\begin{aligned} P(X=\qty( n-k )) & = {}_{n}C_{n-k}p^{n-k}(1-p)^{n} \\ & = {}_{n}C_{k}\qty( \frac{1}{2} )^{n} \end{aligned}\] より, \[P(X=k) = P(X=(n-k)) \notag \] が成立する. したがって, \( B(n,\frac{1}{2}) \) の二項分布は \( k=n-k \) となる \( k = \frac{n}{2} \) に対して対称的な分布となることがわかる. また, \( p=\frac{1}{2} \) 以外の場合, 二項分布は若干歪んだ分布となる.
下図には, \( n = 50 \) に対していくつかの \( p \) を仮定し( \( p = 0.1, 0.5, 0.75 \) ), ある程度の回数試行を繰り返した結果得られる相対ヒストグラムを描いた.
\( p = 0.5 \) の二項分布 \( B(50, 0.5 ) \) は \( 50/2 = 25 \) に対して対称的な分布に近いものが得られていることがわかる. この対称性の良さは試行の回数を増やせば増やすほどよいものとなる.
二項分布
二項分布 \( B\qty( n ,p ) \) とは「yes」の確率が \( p \ \qty( 0 \le p \le 1 ) \) であるような独立試行を \( n \) 回繰り返したときの「yes」の回数 \( X \) の分布を表す. \( n \) 回の独立試行を行った時に, 「yes」が \( k \) 回であるような確率は二項分布によって表される \[P( X = k ) = \frac{n ! }{k ! \qty( n – k ) ! }p^{k }\qty( 1 – p )^{n-k } = {}_{n}C_{k} p^{k } \qty( 1 – p )^{n-k } \notag\] 二項分布 \( B\qty( n ,p ) \) の期待値 \( E \) , 分散 \( V \) , 標準偏差 \( \sigma \) はそれぞれ次のように与えられる. \[ \begin{aligned} E\qty( X ) & = np \\ V\qty( X ) & = npq = np\qty( 1 – p ) \\ \sigma & = \sqrt{npq} = \sqrt{np\qty( 1 – p )} \end{aligned} \] ここで, \( q = 1-p \) である. 二項分布 \( B\qty( n , \frac{1}{2} ) \) は, 期待値 \( n/2 \) について対称的な分布であり, その時最も分散が大きくなる.二項分布の期待値の導出
「Yes」が得られる確率 \( p \) の試行を \( n \) 回繰り返した結果, \( k \) 回の「Yes」が得られる二項分布 \( B(n,k) \) に従う確率変数 \( X=k \) の期待値を求めよう.
ただし, 「Yes」がでる回数の期待値は1回の試行で生じる確率が \( p \) であるとしているので, \( n \) 回試行時の確率変数の期待値は \( np \) となることは事前に予測されており, これを確かめる作業といってもよい.
以下, 二項係数 \( {}_nC_{k} \) と \( {}_{n-1}C_{k-1} \) の間について成り立つ式 \[{}_nC_{k} = \frac{n }{k } {}_{n-1}C_{k-1} \notag \] を利用して二項分布の期待値を求めると[2]念のため, 証明を与えておく. \[\begin{aligned} {}_nC_{k} &= \frac{n!}{k! \qty( n -k )!} \\ &=\frac{n }{k } \cdot \frac{\qty( n -1 )!}{\qty( k-1 )! \qty( \qty( n -1 ) – \qty( … Continue reading, \[\begin{aligned} E\qty( X ) &=\sum_{k=0 }^{n} k P\qty( X =k ) \\ &=\sum_{k=0 }^{n } k \,{}_{n}C_{k} p^{k } q^{n-k } \\ &= 0 \,{}_{n}C_{0} p^{0 } q^{n } + \sum_{k=1 }^{n } k \,{}_{n}C_{k} p^{k } q^{n-k } \\ &=\sum_{k=1 }^{n } k \,{}_{n}C_{k} p^{k } q^{n-k } \\ &=\sum_{k=1 }^{n } k \frac{n}{k} \,{}_{n-1}C_{k-1} p^{k} q^{n-k } \\ &= np \sum_{k=1 }^{n } {}_{n-1}C_{k-1} p^{k-1} q^{n-k } \end{aligned}\] ここで, \( k^{\prime}=k-1 \) とすると, \[\begin{aligned} &= np \sum_{k^{\prime}=0 }^{n-1 } {}_{n-1}C_{k^{\prime}} p^{k^{\prime}} q^{\qty( n -1 ) – k^{\prime} } \\ &= np \qty( p + q )^{n- 1} \\ &= np \quad . \end{aligned}\] となり, 当初の予想通り, 二項分布 \( B(n,p) \) の期待値は \( np \) であることがわかった.
この証明方法について別解を二つほど用意したので興味があれば見てみてほしい.
二項係数について成り立つ関係式 \[ {}_nC_{k} = \frac{n }{k } {}_{n-1}C_{k-1} \notag \] を使わずに愚直に式変形したものを載せておく. \[\begin{aligned} E\qty( X ) &=\sum_{k=0 }^{n} k\,P\qty( X =k ) \\ &=\sum_{k=1 }^{n} k\, P\qty( X =k ) \\ &=\sum_{k = 1}^{n } k\, \frac{n! }{k ! \qty( n – k ) ! }p^{k }q^{n-k } \\ &=\sum_{k = 1}^{n } \frac{n! }{\qty( k -1 ) ! \qty( n – k ) ! }p^{k }q^{n-k } \\ &\underbrace{=}_{k^{\prime} = k-1}\sum_{k^{\prime} = 0}^{n } \frac{n! }{k^{\prime} ! \qty( n – k^{\prime} -1 ) ! }p^{k^{\prime} +1 }q^{n-k^{\prime} -1 } \\ & = \sum_{k^{\prime} = 0}^{n -1 } \frac{n! }{k^{\prime} ! \qty( \qty( n -1 ) – k^{\prime} ) ! }p^{k^{\prime} +1 }q^{\qty( n- 1 ) – k^{\prime} } \\ &= \sum_{k^{\prime} = 0}^{n -1 } \frac{n \cdot \qty( n – 1 )! }{k^{\prime} ! \qty( \qty( n -1 ) – k^{\prime} ) ! }p^{k^{\prime} +1 }q^{\qty( n- 1 ) – k^{\prime} } \\ & = np \underbrace{\sum_{k^{\prime} = 0}^{n -1 } \frac{\qty( n – 1 )! }{k^{\prime} ! \qty( \qty( n -1 ) – k^{\prime} ) ! }p^{k^{\prime} }q^{\qty( n- 1 ) – k^{\prime} } }_{=\qty( p + q )^{n- 1}}\\ &= np \qty( \underbrace{p + q}_{=1} )^{n- 1} \\ &= np \quad . \end{aligned}\] さらに別の手法も紹介しておこう. いま, \( p+q=1 \) であり, 二項定理より \[\qty( p + q )^{n} = \sum_{k=0}^{n}{}_nC_{k} p^{k}q^{n-k} \notag \] が成立している. この式を変数 \( p \) の関数のようにみなして両辺を \( p \) で微分すると, \[n \qty( p + q )^{n-1} = \sum_{k=0}^{n}{}_nC_{k} rp^{k-1}q^{n-k} \notag \] である, さらに両辺に \( p \) を乗じると, \[np \qty( p + q )^{n-1} = \sum_{k=0}^{n}{}_nC_{k} rp^{k}q^{n-k} \notag \] となる. ここで右辺は二項分布の期待値 \( E(X)=\mu \) の定義にほかならず, \[\sum_{k=0}^{n} r {}_nC_{k} p^{k}q^{n-k} = \mu \notag \] であり, 左辺は \[np \qty( \underbrace{p + q}_{=1} )^{n-1} = np \notag \] であるので, 二項分布の期待値 \( \mu \) について, \[\mu = np \notag \] を導き出すことができる.別解1 : 愚直な方法
別解2 : 微分を用いる方法
二項分布の分散の導出
二項分布の分散 \( V(X) \) は期待値 \( \mu \) を用いて次式の左辺で定義され, 右辺のように書き換えることが出来るのであった. \[ \sum_{i=1}^{n} \qty( x_{i} – \mu )^2 f(x_{i}) =E(X^2) – \left\{E(X) \right\}^2 \] この右辺を期待値 \( E(X) \) が持つ線形性を用いて書き換えると, \[\begin{aligned} V\qty( X ) &= E\qty( X^2 ) – \qty( E\qty( X ) )^2 \\ &= E\qty( X(X-1) + X ) + \qty( E\qty( X ) )^2 \\ &= E\qty( X(X-1) ) + E\qty( X ) – \qty( E\qty( X ) )^2 \quad . \end{aligned}\] ここで, \( E\qty( X(X-1) ) \) について, \[\begin{aligned} E\qty( X(X-1) ) &=\sum_{k=0 }^{n} k\qty( k-1 ) {}_{n}C_{k} p^{k } q^{n-k } \\ &=\sum_{k=2 }^{n} k\qty( k-1 ) {}_{n}C_{k} p^{k } q^{n-k } \\ &= \sum_{k=2 }^{n} k\qty( k-1 ) \frac{n}{k} {}_{n-1}C_{k-1} p\cdot p^{k -1 } q^{n-k } \\ &= \sum_{k=2 }^{n} k\qty( k-1 ) \frac{n}{k} \cdot \frac{n-1}{k-1} {}_{n-2}C_{k-2} p^2\cdot p^{k -2 } q^{n-k } \\ &= n\qty( n -1 ) p^2 \sum_{k=2 }^{n} {}_{n-2}C_{k-2} p^2\cdot p^{k -2 } q^{n-k } \\ & = n\qty( n -1 ) p^2 \underbrace{\sum_{\qty( k-2 )= 0 }^{n-2} {}_{n-2}C_{k-2} p^2\cdot p^{k -2 } q^{\qty( n -2 ) – \qty( k -2 ) }}_{= \qty( p + q )^{n- 2}} \\ &= n\qty( n -1 ) p^2 \qty( p + q )^{n- 2} \\ &= n\qty( n -1 ) p^2 \end{aligned}\] という関係式が成立するので, \[\begin{aligned} V( X ) & = E\qty( X(X-1) ) + E\qty( X ) – \qty( E\qty( X ) )^2 \\ & = n\qty( n -1 ) p^2 + np – \qty( n p )^2 \end{aligned}\] \[ \therefore \ V( X )= npq \] を導くことができた.
別解 : 微分を用いる方法
期待値の別解でも紹介した方法の類似で二項分布の分散を計算することができる.
いま, \( p + q = 1 \) を満たす量について二項定理 \[\qty( p + q )^n = \sum_{k=0} {}_{n}C_{k} p^{k}q^{n-k} \notag \] が成立している. この式を変数 \( p \) の関数のようにみなして両辺に対して \( p \) で2回微分を実行すると, \[n\qty( n-1 )\qty( p + q )^{n-2} = \sum_{k=0}^{n} {}_{n}C_{k} k\qty( k-1 )p^{k-2}q^{n-k} \notag \] である. さらに両辺に \( p^2 \) を乗じると, \[n\qty( n-1 )p^2\qty( p + q )^{n-2} = \sum_{k=0}^{n} {}_{n}C_{k} k\qty( k-1 )p^{k}q^{n-k} \notag \] となる. \( p+q=1 \) , \( \mu = np \) という関係に注意しながら上式を式変形していくと, \[\begin{aligned} & n\qty( n-1 )p^2\qty( p + q )^{n-2} = \sum_{k=0}^{n} {}_{n}C_{k} k\qty( k-1 )p^{k}q^{n-k} \\ \to & \mu^2 – \mu p = \sum_{k=0}^{n} {}_{n}C_{k} k^2p^{k}q^{n-k} – \underbrace{\sum_{k=0}^{n} {}_{n}C_{k} kp^{k}q^{n-k}}_{\mu} \\ \to & \mu – \mu p = \sum_{k=0}^{n} {}_{n}C_{k} k^2p^{k}q^{n-k} – \mu^2 \end{aligned}\] ここで, 右辺第一項は確率変数の2乗の期待値 \( E(X^2) \) となっていることに注意すると, 左辺は分散 \( V \) となっていることがわかる.
したがって, 二項分布の分散が \[V = \mu \qty( 1- p ) = np\qty( 1-p ) \notag \] となることを導くことが出来た.
標準偏差 \( \sigma \) は分散の平方根で定義されるので, \[\sigma = \sqrt{V} = \sqrt{np\qty( 1-p )}\] となる.
脚注
⇡1 | 途中, 二項展開の公式 \[ \qty( a+b )^{n} = \sum_{k=0}^{n}{}_{n}C_{k}a^{k}b^{n-k}\] を用いた. |
---|---|
⇡2 | 念のため, 証明を与えておく. \[\begin{aligned} {}_nC_{k} &= \frac{n!}{k! \qty( n -k )!} \\ &=\frac{n }{k } \cdot \frac{\qty( n -1 )!}{\qty( k-1 )! \qty( \qty( n -1 ) – \qty( k -1 ) )!} \\ &= \frac{n }{k } {}_{n-1}C_{k-1} \end{aligned}\] |