標準正規分布

正規分布の基本形ともいえる標準正規分布について議論する.

一般に, ある正規分布に従う確率変数がある範囲内に得られる確率は, 標準正規分布を用いて計算することが出来る. したがって, 標準正規分布に従う確率変数の値がある範囲内に得られる確率計算の手法が確立されていれば, どんな正規分布でも対応する確率計算を行うことができるという利点がある.

まずは正規分布について簡単に復習し, 標準正規分布を用いた確率計算の話題へと移行していく.

正規分布の復習

期待値 \( \mu \) , 標準偏差 \( \sigma \) の正規分布を記号 \( N(\mu, \sigma^2) \) であらわす.

また, 正規分布の確率密度関数を次式で定義する. \[f\qty( x ) = \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{\qty[ – \frac{\qty( x – \mu )^2}{2 \sigma^2 } ]} \quad . \notag \] ここで, \( \exp \) は \[\exp{A} \coloneqq e^{A} \notag\] を表す記号である.

確率変数の標準化

確率変数 \( X \) が正規分布 \( N(\mu, \sigma^2) \) に従うとする. このとき, 次のような新しい変数 \( Z \) を定義する. \[Z \coloneqq \frac{X – \mu}{\sigma} \quad . \notag \] このような変数変換を確率変数の標準化という.

標準化された変数 \( Z \) は \( N(0, 1^2) \) の標準正規分布であり, 次式の確率密度関数に従う確率変数となっている. \[f(z) = \frac{1}{\sqrt{2\pi}}\exp{\qty[ – \frac{z^{2} }{2 } ]} \quad . \notag \] このことの証明は補足にまわし, 標準正規分布の確立密度関数を下図に示す.

正規分布の標準化

確率変数 \( X \) が正規分布 \( N(\mu, \sigma^2) \) に従う確率変数としたとき, 定数 \( a \) , \( b \) を用いた新たな変数 \[Y= a X + b \notag\] は正規分布 \( N(a\mu+b, a^2\sigma^2) \) に従うことを示すことができる.

規格化定数を除いた正規分布の確率密度関数 \[f(x) \propto \exp{\qty[ – \frac{\qty( x – \mu )^{2}}{2\sigma^2} ]} \notag\] を式変形していくと, \[\begin{aligned} f(x) & \propto \exp{\qty[ – \frac{\qty( x – \mu )^{2}}{2\sigma^2} ]} \\ & = \exp{\qty[ – \frac{\qty( ax-a\mu )^{2} }{2 a^{2} \sigma^2 } ]} \\ f(y) & \propto \exp{\qty[ – \frac{\qty( y-b -a\mu )^{2} }{2 a^{2} \sigma^2 } ]} \quad (\because \ y =ax+b) \\ & = \exp{\qty[ – \frac{\left\{y – \qty( a\mu +b ) \right\}^{2} }{2 \qty( a \sigma )^2 } ]} \end{aligned}\] となるので, 確率変数 \( Y \) は期待値が \( a\mu+b \) , 分散が \( a^2\sigma^2 \) の正規分布 \( N(a\mu+b, a^2\sigma^2) \) に従うと言うことができる.

ここで \( y=z \) , \( \displaystyle{a=\frac{1}{\sigma}} \) , \( \displaystyle{b= – \frac{\mu}{\sigma}} \) とすると, \[\begin{aligned} f(z) & \propto \exp{\qty[ – \frac{\left\{z – \qty( \mu +b ) \right\}^{2} }{2 \qty( a \sigma )^2 } ]} \\ & = \exp{\qty[ – \frac{z^{2} }{2 \cdot 1^2 } ]} \end{aligned}\] である.

つぎに, 規格化定数を \( N \) として, 関数 \( f(z) \) を次のようにあらわそう. \[f(z) = N \exp{\qty[ – \frac{z^{2} }{2 \cdot 1^2 } ]} \notag\] この定数 \( N \) の値は \( f(z) \) が確率密度関数の規格化条件の式を満たすように決められる.

正の定数 \( a \) として成り立つ積分公式 \[\int_{ – \infty}^{\infty} \exp{\qty[ -ax^2 ] }\dd{x}= \sqrt{\frac{\pi}{a} } \notag\] を用いて, \[\begin{aligned} \int_{ – \infty}^{\infty} f(z)\dd{z}&= \int_{ – \infty}^{\infty} N \exp{\qty[ – \frac{z^{2} }{2 \cdot 1^2 } ]} \dd{y}\\ & \phantom{=} = N \sqrt{2 \pi} \end{aligned}\] となるので, \( N=\frac{1}{\sqrt{2 \pi}} \) とした正規分布 \( N(0, 1^2) \) の確率密度関数 \[f(z) = \frac{1}{\sqrt{2\pi}}\exp{\qty[ – \frac{z^{2} }{2 \cdot 1^2 } ]} \notag\] は規格化されたものであることを示すことができた.

この標準正規分布がなぜ重要なのかについて触れておこう.

いま, 正規分布 \( N(\mu, \sigma^2) \) に従う確率変数 \( X \) が \( \qty( a, b ) \) の範囲内で観測される確率 \( P(a < X < b) \) は \[\begin{aligned} a^{\prime} &= \frac{a – \mu}{\sigma} \\ b^{\prime} &= \frac{b – \mu}{\sigma} \end{aligned}\] を用いて, \[\begin{aligned} P(a < X < b ) &= P(\frac{a – \mu}{\sigma} < \frac{X – \mu}{\sigma} < \frac{b – \mu}{\sigma} ) \\ &= P(a^{\prime} < Z < b^{\prime} ) \end{aligned}\] と計算することができる.

これは, 確率変数 \( X \) が \( \qty( a, b ) \) の範囲内で観測される確率 \( P(a < X < b) \) と, 変数 \( Z \) が \( \qty( a^{\prime}, b^{\prime} ) \) の範囲内で観測される確率 \( P(a^{\prime} < X < b^{\prime}) \) とを対応付けることができることを示している.

したがって, 標準正規分布で確率を計算する術をもっておけば, (標準正規分布ではない)ほかの正規分布に従う確率変数の値がある範囲内に得られる確率も求めることができるのである.

次節ではこの標準正規分布で確率を計算する術を議論する.

標準正規分布の累積分布関数

確率変数 \( Z \) の値が \( b \) 未満となる確率 \( P(z<b) \qty( =P( – \infty<z<b) ) \) について考えてみよう^[1]「未満」か「以下」かはここでは重要ではない. 教科書の流儀によって等号の有り無しは変わってくる..

単純な発想では次のような積分を実行することで値が得られそうである. \[\int_{ – \infty}^{b} \frac{1}{\sqrt{2\pi}}\exp{\qty[ – \frac{z^2}{2} ]}\dd{z}\label{Pzpro}\] しかしながら, この積分結果は初等的な関数ではあらわすことができないのである.

そこで, \( – \infty \) から \( z \) までの範囲で標準正規分布を積分した式\eqref{Pzpro}を \( z \) の関数とみなし, 累積分布関数または分布関数とよび記号 \( \Phi(z) \) (ファイゼット)であらわすことにする. そして, \( z \) に応じた \( \Phi(z) \) の値を計算機で数値計算した結果を数表としてとっておき, その値を参照することが一般的である. このような事情から統計学の教科書にはかならず数表が付いているのである. \[\begin{aligned} \Phi \qty( z ) \coloneqq & P\qty( – \infty < z < z ) \\ =& \int^{z }_{ – \infty } \frac{1}{\sqrt{2 \pi }} \exp{\qty[ { – \frac{z^2 }{2 }} ]} \end{aligned}\] この \( \Phi(z) \) は関数で書き表すと幾分複雑なようにも見えるが, 図的な解釈をつけるとその意味は明瞭となる. グラフ的には, 下図のように, 標準正規分布と \( t \) 軸の間の, \( t= – \infty \) から \( t=z \) までの領域で囲まれた面積が \( \Phi(z) \) なのである.

\( \Phi(z) \) の数表

標準正規分布の累積分布関数表. \( z=2.13 \) を知りたければ最左列が \( 2.1 \) の行, 最上列が \( .03 \) の列である値を読み取ればよい. \[ \Phi \qty( z ) \coloneqq \int^{\, z }_{ – \infty } \frac{1}{\sqrt{2 \pi }} \exp{\qty( { – \frac{t^2 }{2 }} )}\dd{t}\notag \]

\( z \)	.00	.01	.02	.03	.04	.05	.06	.07	.08	.09
0.0	0.5000	0.5040	0.5080	0.5120	0.5160	0.5199	0.5239	0.5279	0.5319	0.5359
0.1	0.5398	0.5438	0.5478	0.5517	0.5557	0.5596	0.5636	0.5675	0.5714	0.5753
0.2	0.5793	0.5832	0.5871	0.5910	0.5948	0.5987	0.6026	0.6064	0.6103	0.6141
0.3	0.6179	0.6217	0.6255	0.6293	0.6331	0.6368	0.6406	0.6443	0.6480	0.6517
0.4	0.6554	0.6591	0.6628	0.6664	0.6700	0.6736	0.6772	0.6808	0.6844	0.6879
0.5	0.6915	0.6950	0.6985	0.7019	0.7054	0.7088	0.7123	0.7157	0.7190	0.7224
0.6	0.7257	0.7291	0.7324	0.7357	0.7389	0.7422	0.7454	0.7486	0.7517	0.7549
0.7	0.7580	0.7611	0.7642	0.7673	0.7704	0.7734	0.7764	0.7794	0.7823	0.7852
0.8	0.7881	0.7910	0.7939	0.7967	0.7995	0.8023	0.8051	0.8078	0.8106	0.8133
0.9	0.8159	0.8186	0.8212	0.8238	0.8264	0.8289	0.8315	0.8340	0.8365	0.8389
1.0	0.8413	0.8438	0.8461	0.8485	0.8508	0.8531	0.8554	0.8577	0.8599	0.8621
1.1	0.8643	0.8665	0.8686	0.8708	0.8729	0.8749	0.8770	0.8790	0.8810	0.8830
1.2	0.8849	0.8869	0.8888	0.8907	0.8925	0.8944	0.8962	0.8980	0.8997	0.9015
1.3	0.9032	0.9049	0.9066	0.9082	0.9099	0.9115	0.9131	0.9147	0.9162	0.9177
1.4	0.9192	0.9207	0.9222	0.9236	0.9251	0.9265	0.9279	0.9292	0.9306	0.9319
1.5	0.9332	0.9345	0.9357	0.9370	0.9382	0.9394	0.9406	0.9418	0.9429	0.9441
1.6	0.9452	0.9463	0.9474	0.9484	0.9495	0.9505	0.9515	0.9525	0.9535	0.9545
1.7	0.9554	0.9564	0.9573	0.9582	0.9591	0.9599	0.9608	0.9616	0.9625	0.9633
1.8	0.9641	0.9649	0.9656	0.9664	0.9671	0.9678	0.9686	0.9693	0.9699	0.9706
1.9	0.9713	0.9719	0.9726	0.9732	0.9738	0.9744	0.9750	0.9756	0.9761	0.9767
2.0	0.9772	0.9778	0.9783	0.9788	0.9793	0.9798	0.9803	0.9808	0.9812	0.9817
2.1	0.9821	0.9826	0.9830	0.9834	0.9838	0.9842	0.9846	0.9850	0.9854	0.9857
2.2	0.9861	0.9864	0.9868	0.9871	0.9875	0.9878	0.9881	0.9884	0.9887	0.9890
2.3	0.9893	0.9896	0.9898	0.9901	0.9904	0.9906	0.9909	0.9911	0.9913	0.9916
2.4	0.9918	0.9920	0.9922	0.9925	0.9927	0.9929	0.9931	0.9932	0.9934	0.9936
2.5	0.9938	0.9940	0.9941	0.9943	0.9945	0.9946	0.9948	0.9949	0.9951	0.9952
2.6	0.9953	0.9955	0.9956	0.9957	0.9959	0.9960	0.9961	0.9962	0.9963	0.9964
2.7	0.9965	0.9966	0.9967	0.9968	0.9969	0.9970	0.9971	0.9972	0.9973	0.9974
2.8	0.9974	0.9975	0.9976	0.9977	0.9977	0.9978	0.9979	0.9979	0.9980	0.9981
2.9	0.9981	0.9982	0.9982	0.9983	0.9984	0.9984	0.9985	0.9985	0.9986	0.9986
3.0	0.9987	0.9987	0.9987	0.9988	0.9988	0.9989	0.9989	0.9989	0.9990	0.9990

つぎに, 標準正規分布 \( \qty( 0 , 1^2 ) \) における確率 \( P(a<z<b) \) を求めてみよう. これは区間 \( \qty( a , b ) \) で標準正規分布を積分した \[P(a<z<b) = \int_{a }^{b } \frac{1}{\sqrt{2 \pi }} \exp{\qty( { – \frac{z^2 }{2 }} )} \dd{z}\notag \] で与えられる. ただし, 我々が数表として持っている値はある値未満となる確率だけであるので, この値を直接計算することはできない.

そこで, 次のように式変形していこう. この式変形は下に示すような図的な意味もあわせて抑えておくと大変納得の行くものである. \[\begin{aligned} P(a<z<b) &= \int_{a }^{b } \frac{1}{\sqrt{2 \pi }} \exp{\qty( { – \frac{z^2 }{2 }} )} \dd{z} \\ &= \int^{b }_{ – \infty } \frac{1}{\sqrt{2 \pi }} \exp{\qty( { – \frac{z^2 }{2 }} )} \dd{z}\, – \int^{a }_{ – \infty} \frac{1}{\sqrt{2 \pi}} \exp{\qty( { – \frac{z^2 }{2 }} )} \dd{z}\\ &= \Phi \qty( b ) – \Phi \qty( a ) \end{aligned}\] こうして, ある区間に確率変数の値が得られる確率は分布関数 \( \Phi \) のみで記述することができるのである.

また, \( P(z>b) \) となる確率は全確率 \( 1 \) から \( P(z<b)=\Phi(b) \) を引くことで求めることができる. これは, 標準正規分布は \( z = 0 \) について対称であることに注目し, \( P(z>b) \) の確率は \( P(z<-b) \) の確率と全く同じであることから導かれる.

このことも下図と積分を対応させれば納得がいくであろう.

したがって, \[\Phi \qty( -z ) = 1 – \Phi \qty( z ) \notag \] となり, 確率変数が \( \qty( -a , a ) \) の範囲内に値が得られる確率 \( P(-a<z<a) \) は \[\begin{aligned} P(-a<z<a) &= \Phi \qty( a ) – \Phi \qty( -a ) \\ &= \Phi \qty( a ) – \left\{1 – \Phi \qty( a )\right\} \\ &= 2 \Phi \qty( a ) – 1 \end{aligned}\] で計算することができる.

具体例

物理学や統計学でよく用いられる計算の例ついて話しておこう.

正規分布 \( N(\mu, \sigma^2) \) (確率変数 \( X \) )と標準正規分布 \( N(0, 1^2) \) (確率変数 \( Z \) )において, \[P(a < X < b ) = P\qty( \frac{a – \mu}{\sigma} < Z < \frac{b – \mu}{\sigma} ) \notag \] が成立することを利用すると, 正規分布 \( N(\mu, \sigma^2) \) において, 確率変数 \( X \) の値が \( ( \mu – a \sigma , \mu + a \sigma) \) の領域に含まれる確率がどれだけであるかは \[\begin{aligned} & P(\mu-a\sigma < X < \mu+a\sigma ) = P(-a < Z < a ) \\ & \phantom{=} = 2 \Phi \qty( a ) – 1 \end{aligned}\] と累積分布関数 \( \Phi \) を用いて計算することができるのである.

たとえば, 正規分布 \( N(\mu, \sigma^2) \) において \( ( \mu – \sigma , \mu + \sigma) \) の領域に存在するデータの割合は次式と数表を用いることで計算することができる. \[\begin{aligned} P( \mu – \sigma < x < \mu + \sigma) &= 2\Phi \qty( 1 ) -1 \\ &\phantom{=} = 2 \cdot 0.8413 -1 \\ &\phantom{=} = 0.6826 \end{aligned}\] と計算することができ, 正規分布 \( N(\mu, \sigma^2) \) において期待値 \( \mu \) から \( \pm \sigma \) の範囲内に確率変数の値が得られる確率は約 \( 68\% \) であることがわかる.

下表は物理の実験の精度や到達感度を評価する時によく用いる \( a = 1, 2, 3, 4, 5 \) の確率を示している.

\( a \)	\( P(z<a)=\Phi(a) \)	\( P(-a<z<a)=2\Phi(a) – 1 \)
\( 1 \)	0.8413447	0.6826895
\( 2 \)	0.9772498	0.9544997
\( 3 \)	0.9986501	0.9973002
\( 4 \)	0.9999683	0.9999367
\( 5 \)	0.9999997	0.9999994

この表によれば, 正規分布 \( N(\mu, \sigma^2) \) に従う確率変数が期待値 \( \mu \) から \( \pm5\sigma \) の範囲より離れた場所でえられる確率は \[1 – 0.9999994 = 0.0000006 = 6 \times 10^{-5} \notag\] と, とてつもなく低い確率であることがわかる.

脚注[+]

脚注
⇡1	「未満」か「以下」かはここでは重要ではない. 教科書の流儀によって等号の有り無しは変わってくる.