ポアソン分布

離散型確率変数が従う確率分布の代表例, ポアソン分布について議論する.

ポアソン分布は二項分布に並び, 確率分布の中でも非常に重要な確率分布である. 物理においてもポアソン分布に従う確率変数を扱う機会は少なくない.

これから議論するポアソン分布がどのような事象に適用することが出来るのかを紹介しておくため, 幾つかの例をあげよう.

ある人物が書いた文章100文字中に存在するタイプミスの回数.
\( 1\, \mathrm{km} \) 歩いたときの交通事故の発生回数.
\( 1 \) 時間の間に役所にかかってくる電話の数
\( 10\, \mathrm{cm} \) 毎に道端に転がっている石の数
単位時間あたりに自然崩壊する放射性元素の数
\( \cdots \)

これらはどれも, 一定時間または空間の間に偶発的に生じるような事象の数を確率変数としており, それはポアソン分布に従うことが知られている.

まずはポアソン分布の定義を与える. 続いて, ポアソン分布は二項分布のとある極限によって導かれるというポアソンの少数の法則を通してポアソン分布の各種性質(期待値, 分散, 標準偏差)を導出する.

その後, 二項分布をポアソン分布に近似する過程というのを図的な説明を用いて説明し, 締めくくりとして, 再度ポアソン分布の性質をマクローリン展開を利用しながら導出する.

二項分布の復習

まず簡単に, 二項分布の復習を行なう. 二項分布を理解している人は読み飛ばしてもらって構わない.

1回の試行によって事象 \( A \) が生じる確率を \( p \) , 事象 \( A \) が生じない( \( A \) の余事象 \( \bar{A} \) が生じる)確率を \( q=1-p \) とする. \( n \) 回の独立試行を行った結果, 事象 \( A \) が生じる回数を(離散型)確率変数 \( X \) としたときに \( X \) が従う分布を二項分布といい, 記号 \( B(n, p) \) であらわす.

二項分布 \( B(n, p) \) に従う確率変数 \( X \) が \( X=k \) となる確率 \( P^{\prime}(X=k) \) は次式で与えられる. \[\begin{aligned} P^{\prime}(X=k) &= {}_{n}C_{k} p^{k}q^{n-k } \\ &= \frac{n ! }{k ! \qty( n – k ) ! }p^{k}q^{n-k } \quad .\label{bP} \end{aligned}\] また, 二項分布の期待値 \( \mu \) および分散 \( \sigma \) は次式で与えられる. \[\begin{aligned} \mu &= np \\ V &= npq = n p (1-p) \end{aligned}\]

ポアソン分布の定義

ポアソン分布とは次式で定義されるような(離散型)確率分布であり, 確率変数 \( X \) が \( X=k \) となる確率 \( P(X=k) \) が定義されるような分布である. \[P (X =k) = \frac{\lambda^k }{k! } \mathrm{e}^{ – \lambda } \label{PoiEq}\quad . \] ここで, 記号 \( \lambda \) はポアソン分布の期待値であり, 期待値が \( \lambda \) のポアソン分布を \( \mathrm{P }\qty( \lambda ) \) と書く.

後に分かるように, １つのパラメタ — 期待値 \( \lambda \) — だけで期待値, 分散, 標準偏差といった統計学的性質が決定されるというのは, ポアソン分布の非常に大きな特徴といえる.

下図には幾つかの \( \lambda \) に対するポアソン分布 \( \mathrm{P}(\lambda) \) を図示しておく. \( \lambda \) の値が小さいうちは左右の非対称性が顕著であるが, \( \lambda \) の値が大きくなっていくと左右の非対称性が小さくなって行く様子が見てとれる^[1]実はこの性質がガウス分布と呼ばれる統計学で最も重要な確率分布の話へと繋がっていくが, それはまた別の機会に取り上げる..

ポアソンの少数の法則

ポアソン分布(式\eqref{PoiEq})は二項分布 \( B(n, p) \) において確率変数の値が \( k \) となる確率 \[P^{\prime}(X=k) = \frac{n ! }{k ! \qty( n – k ) ! }p^{k}q^{n-k } \notag \] において, 期待値 \( \lambda = np \) を一定に保ちつつ, \( n \) を非常に大きく, \( p \) を非常に小さな値と近似することで得ることができる分布である.

まずは二項分布を次のように書き換えておこう. \[\begin{aligned} P^{\prime}( X = k ) &= \frac{n ! }{k ! \qty( n – k ) ! }p^{k}\qty( 1 – p )^{n-k } \\ &= \frac{n\qty( n-1 ) \cdots \qty( n – \qty( k – 1 ) ) p^{k} }{k ! }\qty( 1 – \frac{\lambda}{n} )^{n-k } \\ &= \frac{1}{k !}\cdot 1 \cdot \qty( 1 – \frac{1 }{n } ) \cdots \qty( 1 – \frac{\qty( k – 1 ) }{n } ) n^{k}p^{k} \qty( 1 – \frac{\lambda}{n} )^{n-k } \\ &= \frac{\lambda^{k} }{k! } 1 \cdot \qty( 1 – \frac{1 }{n } ) \cdots \qty( 1 – \frac{\qty( k – 1 ) }{n } ) \frac{\qty( 1 – \frac{\lambda}{n} )^{n } }{\qty( 1 – \frac{\lambda}{n} )^{k} } \end{aligned}\] この \( P^{\prime}(X=k) \) に対して \( \lambda=np \) を固定しつつ, \( n \to \infty \) を適用してみよう. ただし, \[\begin{aligned} & \lim_{n \to \infty} 1 \cdot \qty( 1 – \frac{1 }{n } ) \cdots \qty( 1 – \frac{\qty( k – 1 ) }{n } ) = 1 \\ & \lim_{n \to \infty} \qty( 1 – \frac{\lambda}{n} )^{k} =1 \end{aligned}\] であること, さらにネイピア数の定義 \[e \coloneqq \lim_{x \to \pm \infty} \qty( 1 + \frac{1}{x} )^{x}\notag \] に従うと, \[\begin{aligned} & \lim_{n \to \infty } \qty( 1 – \frac{\lambda}{n} )^{n} =\lim_{n \to \infty } \left\{\qty( 1 – \frac{\lambda}{n} )^{ – \frac{n}{\lambda}} \right\}^{ – \lambda} \\ & \phantom{=} = \lim_{x \to – \infty} \left\{\qty( 1 + \frac{1}{x} )^{x} \right\}^{ – \lambda} \quad \qty( x = – \frac{n}{\lambda} ) \\ & \phantom{=} = e^{ – \lambda} \end{aligned}\] であることを用いると, \[\lim_{n \to \infty } P^{\prime}(X=k) = \frac{\lambda^k}{k!}e^{ – \lambda} \notag \] が得られる.

このような極限において, 二項分布がポアソン分布と一致する定理をポアソンの少数の法則という.

期待値 \( \lambda = np \) の二項分布 \( B(n, p ) \) とポアソン分布 \( \mathrm{P}(\lambda) \) の比較を行おう.

下図には, \( \lambda =3 \) のポアソン分布 \( \mathrm{P}(3) \) の棒グラフと \( \lambda =3 \) を一定に保ったまま, \( n \) を大きく, \( p \) を小さくしていった二項分布 \( B(5, \frac{3}{5} ) \) , \( B(30, \frac{3}{30} ) \) , \( B(5, \frac{3}{100} ) \) を同時に描いた.

\( n = 30 \) の時点でだいぶよく一致しており, \( n =100 \) では二項分布とポアソン分布はほぼ一致しており, ポアソンの少数の法則を実感することができる.

ポアソン分布の性質

ポアソン分布の性質を導出していくが, ここではしばらくの間, ポアソン分布はポアソンの少数の法則によって得られた確率分布であるとして, つまり, 二項分布の極限として得られた分布として議論することにする.

ポアソン分布の定義式\eqref{PoiEq} \[P (X =k) = \frac{\lambda^k }{k! } \mathrm{e}^{ – \lambda } \notag \] から出発した各種性質の証明は後半に持ち越すことにするのでそれが気になる人はポアソン分布の性質の証明へ進んでほしい.

規格化

ポアソン分布 \( P(X=x_{i}) = f(x_{i}) \) はすでに規格化条件の式 \[\sum_{i} f(x_{i}) = 1 \label{pnat}\] を満たしている. ここで \( \sum_{i} \) は確率変数 \( X=x_{i} \) が取り得る全ての値について和をとることを意味している.

ポアソン分布が規格化条件の式\eqref{pnat}を満たしていることは, 二項分布に対する式 \[\sum_{i=1}^{n} f^{\prime}(x_{i}) = \sum_{k=0}^{n} \frac{n ! }{k ! \qty( n – k ) ! } p^{k}\qty( 1-p )^{n-k } \notag \] に対して, \( n \to \infty \) という極限を適用すればわかる. \[\begin{aligned} \sum_{i=1}^{n} f(x_{i}) &= \lim_{n \to \infty } \sum_{i=1}^{n} f^{\prime}(x_{i}) \\ &= \lim_{n \to \infty } \sum_{k=0}^{n} \frac{n ! }{k ! \qty( n – k ) ! } p^{k}\qty( 1-p )^{n-k } \\ &= \lim_{n \to \infty } \qty( p + (1-p) )^{n} \\ &= 1 \quad . \end{aligned}\]

期待値

ポアソン分布の導出にあたり, 二項分布の期待値 \( \lambda = np \) が一定であることを要請していた. したがって, ポアソン分布の期待値は \( \lambda \) に一致している. \[E\qty( X ) = np = \lambda \quad . \]

分散, 標準偏差

ポアソン分布の分散 \( V \) は, 次式で与えられる二項分布の分散 \( V^{\prime} \) \[V^{\prime} = np(1-p) \notag \] に対して, \( \lambda=np=\mathrm{const.} \) , \( n\to\infty \) を適用すれば得られる. \[V\qty( X ) = \lim_{n \to \infty} V^{\prime} = \lambda \quad . \notag \]

標準偏差 \( \sigma \) は分散の平方根で定義されるので, \[\sigma = \sqrt{V} = \sqrt{\lambda} \notag \] となる.

二項分布からポアソン分布へ

二項分布 \( B(n, p) \) において, 期待値 \( \lambda=np \) を一定に保ちつつ, \( n\to\infty \) , \( p\to0 \) という近似を適用した場合に現れる確率分布がポアソン分布 \( \mathrm{P}(\lambda) \) に一致することはすでに述べた(ポアソンの少数の法則).

ここでは, \( B(n, p) \) がある条件下で \[B(n, p) \to \mathrm{P}(\lambda) \notag\] と解釈できるポアソンの少数の法則の思考過程を図を通して紹介する.

下図に示すような区間を単位区間とみなし, 単位区間中に偶発的に事象 \( A \) が平均 \( \lambda \) 回生じるような事例について考えよう. 下図中の赤丸は事象 \( A \) が生じた点を表し, それ以外の点では事象 \( A \) が生じていないと解釈してほしい.

この単位区間とは, 例えば「1時間」というある時間の幅であったり, 「 \( 10\, \mathrm{cm} \) 」というある空間の幅, 「 \( 1000 \) 回の試行を繰り返す」などを想像してもらえばよい. 事象 \( A \) は「電話がかかってくる」であったり, 「落ちている石の数」, それこそ「 \( 1 \) 回の独立試行」などを想像してもらえばよい.

上図の場合, 単位区間あたり \( 6 \) 回の事象 \( A \) が生じており, 単位区間に平均 \( \lambda=6 \) が得られるような事象であると考えてほしい.

このような単位区間をさらに細かい区間に区切ってみよう. 下図には区間の数 \( n \) を \( n=4, 10 \) としてみたときに, その区間の内部で事象 \( A \) が生じたがどうかで色分けしている.

当然ながら, 分割された区間の数 \( n \) が少なければ区間中で事象 \( A \) が生じる確率はたかく, また, 同一の区間内に事象 \( A \) が複数回観測されることも多い.

下図は単位区間を \( 36 \) 個の微小区間に分割した, \( n=36 \) の場合である.

このように細分化された各微小区間内で事象 \( A \) が生じる可能性 \( p \) は, 微小区間の幅に応じて小さくなっていく. ただし, \( p \) の小さくなっていく具合は勝手なものではなく, 単位区間での平均が \( \lambda \) となる条件を保つように小さくなっていかなければならない. すなわち, 単位区間で事象 \( A \) が生じる平均 \( \lambda = np \) を一定に保つように \( p \) が減少していくことを意味している.

今の場合, \( \lambda=6 \) を一定に保ったまま, 微小区間の数を \( n=36 \) 個まで増やしているので, 各微小区間で事象 \( A \) が生じる確率は \( p=\lambda/n=6/36=1/6 \) とするのである.

このような, ある単位区間の数を \( n \) 個の微小区間に分けていく操作において, 同一の区間に事象 \( A \) が複数回生じる可能性を排除できるほどの微小区間に分割するのに十分な \( n \) であるとしよう. このようにして単位区間を分割した微小区間が \( n \) 個存在するとき, 各微小区間において事象 \( A \) が生じる確率 \( \displaystyle{p = \frac{\lambda}{n} } \) は非常に小さくなる.

このような操作後に, 改めて単位区間あたりに事象 \( A \) が生じる回数を確率変数として考えなおしてみよう.

単位区間中に微小区間は \( n \) 個存在し, その各区間で \( A \) が生じる確率は \( \displaystyle{p=\frac{\lambda}{n}} \) であるので, 単位区間中に事象 \( A \) が生じる回数は( \( \lambda=np \) という条件付きで \( n \to \infty \) , \( p \to 0 \) の)二項分布 \( B(n, p) \) に従うと解釈することができる.

ここで, 二項分布 \( B(n, p) \) に従う確率変数 \( X \) の値が \( k \) となるような確率 \( P^{\prime}(X=k) \) に対して, \( \lambda=\lambda=\mathrm{const.} \) , \( n\to\infty \) という極限を適用して得られる分布は, ポアソンの少数の法則で証明したように, \[ \lim_{n \to \infty }P^{\prime}(X=k) = \frac{\lambda^k }{k! } \mathrm{e}^{ – \lambda } \notag \] である.

このように, ランダムに生じる事象の単位区間で期待値が分かっておけば, 導出の過程では二項分布を持ち出すが, 最終的にはポアソン分布に一致することを導出することができる.

よく, ポアソン分布は偶発的に生じる確率が非常に小さな事象に対して成立すると紹介される. これは上記の思考過程において \( p\to0 \) という極限操作に相当している. しかし, 同時に \( n \to \infty \) という極限操作も行なっており, 単位区間で生じる回数の期待値 \( \lambda=np \) は一定であることに注意してほしい.

確率が小さいという言葉は微小区間の中で事象が生じる確率 \( p \) が小さいことを意味しており, 単位区間で生じる回数 \( \lambda \) が小さいと解釈してはならない.

例えば, 飛行機事故に遭う確率を仮に10万分の1とし, 飛行機に1000回乗った時に事故に遭遇する回数を確率分布として扱うような事例では, 1回飛行機に乗るというのが微小区間に相当し, 飛行機事故に遭う確率が \( p \) に相当し, \( p = \frac{1}{10^{5}} \) である. そして, 1000回飛行機に乗るが単位区間に相当する. また, 単位区間で事故に遭う期待値 \( \lambda \) は \( \lambda = \frac{1000}{10^{5}} = \frac{1}{100} \) である. したがって, 当初の問題である飛行機に1000回乗った時に事故に遭遇する回数は \( \lambda = \frac{1}{100} \) のポアソン分布 \( \mathrm{P}(\frac{1}{100}) \) に従うのであり, \( p \) が小さいことが与えられた問題例である.

別の例として, 1分間の間の電話の着信数が3回であるとわかっているとしよう. これは, 単位区間での期待値 \( \mu \) が \( 3 \) であるとわかっている問題の例である. ここで, これまで述べてきた発想を用いることで, 1分間の間の着信数は \( \mathrm{P}(3) \) に従うということができるのである.

ポアソン分布の性質の証明

指数関数のマクローリン展開

ポアソン分布の式 \[P (X =k) = \frac{\lambda^k }{k! } \mathrm{e}^{ – \lambda } \notag \] から出発して, ポアソン分布の各性質を証明していこう. これには, 指数関数 \( e^{x} \) をべき級数に書き換えることが出来るという, マクローリン展開を利用する必要がある.

指数関数 \( e^{x} \) はマクローリン展開により次の級数に書き換えることが出来る \[\begin{aligned} e^{x} & = \sum_{k=0}^{\infty} \frac{x^{k}}{k!} \\ & = 1 + x + \frac{x^{2}}{2!} + \frac{x^{3}}{3!} + \cdots \quad . \end{aligned}\]

規格化条件の証明

ポアソン分布が規格化条件の式\eqref{pnat}を満たしていることは次のように示すことができる. \[\begin{aligned} &\sum_{k=0}^{\infty}P(X=k) = \sum_{k=0}^{\infty}\frac{\lambda^{k}}{k!}e^{ – \lambda} \\ &\phantom{=}= \frac{\lambda^{0}}{0!}e^{ – \lambda} + \frac{\lambda^{1}}{1!}e^{ – \lambda} + \frac{\lambda^{2}}{2!}e^{ – \lambda} + \frac{\lambda^{3}}{3!}e^{ – \lambda} + \cdots \\ &\phantom{=}= e^{ – \lambda} \qty( 1 + \lambda + \frac{\lambda^2}{2!} + \frac{\lambda^3}{3!} + \cdots ) \\ &\phantom{=}= e^{ – \lambda} e^{\lambda} \\ &\phantom{=}= 1 \quad . \end{aligned}\]

少し似た手法ではあるが, 覚えやすい証明方法として, 指数関数 \( e^{x} \) のマクローリン展開の両辺に \( e^{ – \lambda} \) を乗じ, \[ \begin{aligned} e^{\lambda} & = \sum_{k=0}^{\infty} \frac{\lambda^{k}}{k!} \\ \to \ 1 &= \sum_{k=0}^{\infty} \frac{\lambda^{k}}{k!} e^{ – \lambda} \\ \therefore \ 1 &= \sum_{k=0}^{\infty} P(X=k) \quad \qty( \because \ \frac{\lambda^{k}}{k!} e^{ – \lambda} = P(X=k) ) \end{aligned}\] としてもポアソン分布が規格化条件の式\eqref{pnat}を満たしていることを示すことができる.

期待値の導出

ポアソン分布の期待値は, 期待値の定義式および指数関数のマクローリン展開より, 次のように導出することができる. \[\begin{aligned} E(X) &= \sum_{k=0}^{\infty} k P(X=k) \\ &= \sum_{k=0}^{\infty} k \frac{\lambda^{k}}{k!}e^{ – \lambda} \\ &= 0 \cdot \frac{\lambda^{0}}{0!}e^{ – \lambda} + 1 \cdot \frac{\lambda^{1}}{1!}e^{ – \lambda} + 2 \cdot \frac{\lambda^{2}}{2!}e^{ – \lambda} + 3 \cdot \frac{\lambda^{3}}{3!}e^{ – \lambda} + \cdots \\ &= \lambda e^{ – \lambda} \qty( 1 + \lambda + \frac{\lambda^2}{2!} + \frac{\lambda^3}{3!} + \cdots ) \\ &= \lambda e^{ – \lambda} e^{\lambda} \\ & = \lambda \quad . \end{aligned}\]

分散の導出

ポアソン分布の分散を導出するに当たり, 分散の定義式から少し書き換えを行なってみよう. \[\begin{aligned} V\qty( X ) &= E\qty( X^2 ) – \qty( E\qty( X ) )^2 \\ &= E\qty( X(X-1) + X ) – \qty( E\qty( X ) )^2 \\ &= E\qty( X(X-1) ) + E\qty( X ) – \qty( E\qty( X ) )^2 \end{aligned}\] ここで, \( E(X(X-1)) \) について, \[\begin{aligned} &\sum_{k=0}^{\infty} k \qty( k-1 ) \frac{\lambda^{k}}{k!}e^{-k} = \sum_{k=2}^{\infty} k \qty( k-1 ) \frac{\lambda^{k}}{k!}e^{-k} \\ &\phantom{=}= \lambda^2 e^{ – \lambda} \sum_{k=2}^{\infty} \frac{\lambda^{k-2}}{\qty( k-2 )!} \\ &\phantom{=}= \lambda^2 e^{ – \lambda} \qty( 1+ \lambda + \frac{\lambda^2}{2!}+ \cdots ) \\ &\phantom{=}= \lambda^2 e^{ – \lambda} e^{\lambda} \\ &\phantom{=}= \lambda^2 \end{aligned}\] であることを用いると, \[\begin{aligned} V\qty( X ) &= E\qty( X(X-1) ) + E\qty( X ) – \qty( E\qty( X ) )^2 \\ &= \lambda^2 + \lambda – \lambda^2 \\ &= \lambda \quad . \end{aligned}\]

脚注[+]

脚注
⇡1	実はこの性質がガウス分布と呼ばれる統計学で最も重要な確率分布の話へと繋がっていくが, それはまた別の機会に取り上げる.