逆正弦分布

連続型確率変数が従う確率分布の例として, 逆正弦分布を紹介する.

逆正弦分布は, 正弦波のように繰り返される背景事象を含んだ実験の解析などでみかける分布である.

例えば, 電気的な雑音(ノイズ)というのは各家庭に供給されている交流の周期に同調して現れやすくなっている. したがって, 非常に精度よく電圧等の測定を行うことでこの雑音による測定値の乱れなどが見えてくる可能性がある.

また, ある周期で単振動している物体をランダムなタイミングでチラッと見た時にどこにいるのか, という分布もこの逆正弦分布に従う. まずはこの具体例を通して, 分布の形状について簡単に触れてもらったあとで, 逆正弦分布の確率密度関数を導出する.

最後には, この逆正弦分布と特徴を類するお話として, ギャンブルの浮き沈みの期間の分布の話題(逆正弦法則)も簡単に紹介する.

逆正弦分布の具体例 : 単振動の観測

\( x \) 軸上の原点を中心として, 振幅 \( a \) , 角周波数 \( \omega \) , 周期 \( T=2\pi/\omega \) で単振動している物体の時刻 \( t \) における位置 \( x(t) \) が \[x = a \sin{\omega t} \label{xham} \] で与えられる物体について考える.

このように振動している物体の位置を時刻 \( t=0 \) から \( t=T \) までの間のランダムなタイミングでチラッと見てその位置を記録する, という実験を繰り返し行い, 1回目の実験結果を \( x_{1} \) , 2回目の実験結果を \( x_{2} \) といった具合に記録していく.

このような実験を非常に多数回数繰り返したとき, その観測位置の分布がどうなっているのか, に興味がある.

諸君も, まずは想像力をフルにつかって, どのような結論が得られるのか想像してみていただきたい.

下図は, 計算機の中で上記の実験を繰り返し \( 10000 \) 回行なった結果得られた位置の分布をヒストグラム化したものである. 諸君の想像と比べてどうであろう, 似通った想像ができたであろうか.

上手く想像ができなかった人は, 位置が式\eqref{xham}で与えられるような物体の速度 \( v \) は位置の微分 \[v = \dv{x}{t} = a\omega \cos{\omega t} \notag \] であることから, 変位 \( x \) の絶対値がもっとも大きい箇所, すなわち, \( \omega t \approx \frac{\pi}{2} \) や \( \omega t \approx – \frac{\pi}{2} \) といった箇所では速度がもっとも遅くなり滞在時間が長くなっていること, 単振動している物体が原点付近を通り過ぎるときは速度が最大になっており中々その瞬間が観測されないこと, などを考慮すれば納得していただけるであろう.

また, 上図には測定結果のヒストグラムに加えて, \( x=0 \) を中心とした逆正弦分布の確率密度関数 \( f(x) \) を調度良いくらいに定数倍した曲線を重ね書きしている. ここで, \( f(x) \) は次式で定義されるような, U字形の関数である. \[\therefore \ f(x)= \begin{cases} \frac{1}{\pi} \frac{1}{\sqrt{a^2-x^2}} & ( -a < x < a) \\ 0 & ( x \le -a , a \le x) \end{cases} \notag \]

このように, 振動している物体の位置をランダムに観測する, という測定において登場する分布が逆正弦分布である.

逆正弦分布の確率密度関数の導出

逆正弦分布の確率密度関数 \( f(x) \) の導出を行う.

確率変数 \( X \) が, \( – \pi \sim \pi \) の範囲で一様分布に従う確率変数 \( \Theta \) (シータ)と次式のような関係であるとする. \[X = a \sin{\Theta} \label{Xsin} \quad .\] 上記の具体例で示されたように, この確率変数 \( X \) が従う確率密度関数 \( f(x) \) こそ逆正弦分布であり, この \( f(x) \) を導出することを考える.

まずは, \( b \sim b+a \) までの間で一様分布に従うような確率変数 \( X \) が従う確率密度関数 \( f(x) \) は次式で与えられることを思い出そう. \[f(x)= \begin{cases} \frac{1}{a} & (b \le x < b+a) \\ 0 & (x < b , b+a \le x) \end{cases} \quad . \notag \] いま, 確率変数 \( \Theta \) の値 \( \theta \) も \( – \pi \sim \pi \) の範囲で一様分布に従うと仮定していたので, \( \Theta \) の従う確率密度関数を \( p(\theta) \) とすると, \( p(\theta) \) は次式で与えられる. \[p(\theta)= \begin{cases} \frac{1}{2\pi} & ( – \pi \le \theta < \pi) \\ 0 & ( \theta < – \pi , \pi \le \theta ) \end{cases} \quad .\] したがって, このような確率密度関数 \( p(\theta) \) に従う確率変数が \( \theta \sim \theta +\dd{\theta}\) という微小幅 \(\dd{\theta}\) の範囲に観測される確率は \[p(\theta)\,\dd{\theta} \label{ppro}\] で与えられる.

また, 確率変数 \( X \) が \( x \sim x+\dd{x} \) の範囲内に観測される確率は, \( X \) が従う確率密度関数を \( f(x) \) とすると \[f(x) \dd{x} \label{xpro}\] で与えられる. この確率密度関数 \( f(x) \) はまだ定かではないが, 式\eqref{ppro}と式\eqref{xpro}は無関係ではなく, \[x = a \sin{\theta} \notag \] という関係式によって結びついており, \( \theta \sim \theta +\dd{\theta}\) は \( x \sim x+\dd{x} \) に対応していることがヒントとなる. つまり, 式\eqref{ppro}と式\eqref{xpro}は共に同じ確率をあらわしている. ただし, 下図から分かるように, 確率変数 \( \Theta \) の範囲が \( – \pi \sim \pi \) において, \( x \sim x+\dd{x} \) に対応している \( \theta \sim \theta +\dd{\theta}\) は都合2箇所あることを考慮すると, \[f(x) \dd{x} = 2 \cdot p(\theta)\,\dd{\theta} \label{pxpro}\] が成立していることがわかる.

以上より, 式\eqref{pxpro}を \( f(x) \) について整理し, \( – \theta \sim \theta \) の範囲で \[ p(\theta) = \frac{1}{2\pi} , \ \dv{x}{\theta} = a\cos{\theta} \notag \] 等が成立していることを用いると, \[\begin{aligned} f(x) &= 2 p(\theta) \dv{\theta}{x} \\ &= 2 \frac{1}{2\pi} \frac{1}{\dv{x}{\theta}} \\ &= \frac{1}{\pi} \frac{1}{a\cos{\theta}} \\ &= \frac{1}{\pi} \frac{1}{a\sqrt{1 – \sin[2]{\theta}}} \end{aligned}\] \[\therefore \ f(x)= \frac{1}{\pi} \frac{1}{\sqrt{a^2-x^2}}\]

このようにして, 逆正弦関数の確率密度関数が得られたので, その概形を下図に示しておく.

逆正弦分布の性質

規格化

逆正弦分布の確率密度関数 \[f(x)= \begin{cases} \frac{1}{\pi}\frac{1}{\sqrt{a^2-x^2}} & ( – a < x < a ) \\ 0 & ( x \le -a, a \le x ) \end{cases} \quad .\] は確率密度関数が満たすべき式 \[\int_{ – \infty}^{\infty}f(x) \dd{x} =1 \label{p_nat}\] を満たしていることを示しておこう.

逆正弦分布 \( f(x) \) を式\eqref{p_nat}に代入する. \[\int_{ – \infty}^{\infty} f(x) \dd{x} = \int_{-a}^{a} \frac{1}{\pi}\frac{1}{\sqrt{a^2-x^2}} \dd{x} \notag \] ここで, \( x=a\sin{\theta} \) と置換し, \[\dv{\theta}{x} = \frac{1}{\sqrt{a^2-x^2}} \label{asindif}\] であることを利用すると^[1]証明を与えておく. \( x=a\sin{\theta} \) の両辺を \( x \) で微分すると, \[\begin{aligned} & \frac{x}{a} = \sin{\theta} \\ \to &\dv{x} \qty( \frac{x}{a} ) = \dv{x}\sin{\theta} … Continue reading, \[\begin{aligned} &= \int_{-a}^{a} \frac{1}{\pi}\frac{1}{\sqrt{a^2-x^2}} \dd{x} \\ &= \int_{ – \frac{\pi}{2}}^{\frac{\pi}{2}}\frac{1}{\pi}\,\dd{\theta} \\ &= \frac{1}{\pi}\qty[ \theta ]_{ – \frac{\pi}{2}}^{{\frac{\pi}{2}}} \\ &= 1 \end{aligned}\] であり, \( f(x) \) は規格化条件の式\eqref{p_nat}を満たしていることがわかる^[2]この一連の積分においては, 広義積分の考え方を適用している. すなわち, \( ( -a , a) \) で定義された関数 \( f(x) \) において, \[ \lim_{\epsilon \to +0 } … Continue reading.

期待値

逆正弦関数 \( f(x) \) の期待値を, 期待値の定義式 \[E(X) = \int_{ – \infty}^{\infty} xf(x) \dd{x} \notag\] に代入して求めてみよう. \[\begin{aligned} &\int_{ – \infty}^{\infty} xf(x) \dd{x} = \int_{-a}^{a} \frac{1}{\pi}\frac{x}{\sqrt{a^2-x^2}} \dd{x} \\ \phantom{=}&=\frac{-1}{\pi}\qty[ \sqrt{a^2-x^2} ]_{-a}^{a} \\ \phantom{=}&=0 \end{aligned}\]

分散, 標準偏差

逆正弦関数 \( f(x) \) の分散 \( V(X) \) は期待値 \( E(X) \) を用いて, \[E(X^2) – \left\{E(X)\right\}^2\] で求めることができる.

\( E(X^2) \) について, \( x=a\sin{\theta} \) という置換に加えて式\eqref{asindif}を用いると, \[\begin{aligned} E(X^2) &= \int_{ – \infty}^{\infty} x^2f(x) \dd{x} \\ &= \int_{-a}^{a} x^2\frac{1}{\pi}\frac{1}{\sqrt{a^2-x^2}} \dd{x} \\ &= \frac{a^2}{\pi} \int_{ – \frac{\pi}{2}}^{\frac{\pi}{2}} \sin[2]{\theta}\,\dd{\theta} \\ &= \frac{a^2}{\pi} \int_{ – \frac{\pi}{2}}^{\frac{\pi}{2}} \frac{1 – \cos{2\theta}}{2}\,\dd{\theta} \\ &= \frac{a^2}{2\pi} \qty[ \theta – \frac{1}{2} \sin{2\theta} ]_{ – \frac{\pi}{2}}^{\frac{\pi}{2}} \\ &= \frac{a^2}{2} \end{aligned}\] \[ \therefore \ V(X) = \frac{a^2}{2} \] であることがわかる.

標準偏差 \( \sigma \) は分散の平方根で定義されるので, \[\sigma = \sqrt{V(X)} = \frac{a}{\sqrt{2}}\] となる.

次式のような規格化された確率密度関数 \( f(x) \) を逆正弦分布という. \[f(x)= \begin{cases} \frac{1}{\pi}\frac{1}{\sqrt{a^2-x^2}} & ( – a < x < a ) \\ 0 & ( x \le -a, a \le x ) \end{cases} \quad . \notag \] であり, 期待値 \( E(X) \) , 分散 \( V(X) \) , 標準偏差 \( \sigma \) は次のようにあらわされる. \[ \begin{aligned} E(X) & = 0 \\ V(X) & = \frac{a^2}{2} \\ \sigma & = \frac{a}{\sqrt{2}} \end{aligned}\] より一般に, \( a < x < b \) の範囲内で定義された逆正弦分布 \( f(x) \) は次のようにあらわされる. \[f(x)= \begin{cases} \frac{1}{\pi}\frac{1}{\sqrt{(x-a)(b-x)}} & ( a < x < b ) \\ 0 & ( x \le a, b \le x ) \end{cases} \quad . \notag \] \[ \begin{aligned} E(X) & = \frac{a+b}{2} \\ V(X) & = \frac{1}{8}\qty( b – a )^2 \end{aligned}\]

ギャンブルの浮き沈みと逆正弦法則

逆正弦分布に近似的に従うような現象の例として, ギャンブルの浮き沈みが知られている.

近似的にとつけたのは, 以下で紹介する例は二項分布のある極限で得られる結論が, 逆正弦分布のそれとほぼ同じであることを意味しており, その導出はココでは行わず, お話だけにとどめておく.

あるギャンブルに勝利する確率 \( p \) が \( p=0.5 \) で与えられる場合を考えてみよう. このギャンブルを多数回行う間, 浮き(勝ち越し)が持続している回数を確率変数にとるのである.

この状況をわかりやすくるために, 下図に示すような例を考えてみよう. 勝率 \( p \) が \( p=0.5 \) のギャンブルを \( 30 \) 回繰り返す間, 初期状態から浮き(勝ち越し)が持続している回数を確率変数 \( X \) とするのである. 下図の場合 \( X=18 \) が得られることになる.

このような実験を多数回行なった時, 浮き(勝ち越し)の分布 \( X \) がどうなるかをまずは直感的に予測してみてほしい.

下図には, 計算機がランダムにこのギャンブルを繰り返したときの様子を示している.

皆さんの想像と比べてどうであろうか. 上記の図では \( X \) が極端に大きな値や小さな値が多く得られるいる数が想像よりも幾分多く感じられないだろうか. すなわち, 浮き沈みに偏りがあるように感じられないであろうか.

これだけではよくわからないという人のために, 上記の実験を \( 3000 \) 回繰り返した時の \( X \) の分布の結果を次図に示しておく.

この分布の形状は逆正弦分布として紹介したものと非常によく似通っており, 実際, 逆正弦分布に近似的に従っていることを示すことができ, 逆正弦法則として知られている.

上記の結果をよく考えてみると, ギャンブルで負け越した状態から勝ち越した状態に移行するためには, まずもって負け越しの状態から初期の状態までこなくてはならない. その分だけの労力をまず持って発揮したうえで, さらに勝ちを続けることでようやく勝ち越しに至るのである. こう考えてみると, 割合納得できる結論とも言えるのではないであろうか.

ギャンブル好きの人は(実際のギャンブルが公平とは言えないことを頭に入れながら)色々と情報収集してみるのもよいであろう^[3]ちなみに私はギャンブルは嫌いである..

脚注[+]

脚注
⇡1	証明を与えておく. \( x=a\sin{\theta} \) の両辺を \( x \) で微分すると, \[\begin{aligned} & \frac{x}{a} = \sin{\theta} \\ \to &\dv{x} \qty( \frac{x}{a} ) = \dv{x}\sin{\theta} \\ \to &\frac{1}{a} = \dv{\theta}{x} \cos{\theta} \\ \to &\dv{\theta}{x} = \frac{1}{a\cos{\theta}} = \frac{1}{a\sqrt{1 – \sin{\theta}}} \\ \therefore \ &\dv{\theta}{x} = \frac{1}{\sqrt{a^2-x^2}} \quad . \end{aligned}\]
⇡2	この一連の積分においては, 広義積分の考え方を適用している. すなわち, \( ( -a , a) \) で定義された関数 \( f(x) \) において, \[ \lim_{\epsilon \to +0 } \int_{-a+\epsilon}^{a – \epsilon} f(x) \dd{x} \notag \] のことを単に \( \int_{-a}^{a} f(x) \dd{x} \) と書いている. 物理屋さんはこの辺りは割と大雑把であるが, 多くの場合問題にはならない.
⇡3	ちなみに私はギャンブルは嫌いである.