Kevin's Data Analytics Blog

データサイエンティスト、AIエンジニアを目指す方に向けて情報発信していきます。

確率分布の期待値・分散・母関数まとめ~連続分布~

以前の記事に続き、統計検定1級/準1級の対策として、各確率分布の期待値・分散・母関数について整理しました。
今回は、連続分布を扱いました。
離散分布のまとめについてはこちらを参照ください。
確率分布の期待値・分散・母関数まとめ~離散分布~ - Kevin's Data Analytics Blog

1. 連続一様分布

定義

𝑎<𝑥<𝑏の連続値をとる確率変数𝑋に対して、確率密度関数の値が常に一定であるような確率分布を連続一様分布という。

期待値

 E(X)=\dfrac{a+b}{2}

分散

 V(X)=\dfrac{(b-a)^{2}}{12}

積率母関数(モーメント母関数)

 E(t^{tX})=\dfrac{e^{tb}-e^{ta}}{t(b-a)}

2. 正規分布

定義

𝜇∈"ℝ, " σ>0とし、確率変数𝑋に対して、以下の確率密度関数をもつ分布を正規分布という。𝜇を中心する左右対称の釣鐘型の分布になっている。

期待値

 E(X)=\mu

分散

 V(X)=\sigma^ 2

積率母関数(モーメント母関数)

 E(t^{tX})=\exp(\mu t+\dfrac{\sigma^2 t^2}{2})

3. 指数分布

定義

 λ>0とし、確率変数𝑋に対して、以下の確率密度関数をもつ分布を指数分布という。単位時間あたり平均λ回起こる現象の発生間隔の確率分布を表している。

期待値

 E(X)=\dfrac{1}{\lambda}

分散

 V(X)=\dfrac{1}{\lambda ^2}

積率母関数(モーメント母関数)

 E(t^{tX})=\dfrac{\lambda}{\lambda - t}  \quad (t < \lambda)

4. ガンマ分布

定義

 α>0, 𝛽>0 とし、確率変数𝑋に対して、以下の確率密度関数をもつ分布をガンマ分布という。ガンマ分布は単位時間あたり平均𝛽回起こる現象がα回起こるまでの時間の確率分布を表している。

確率密度関数

 f(x)=\frac{\beta^{\alpha}}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} \quad (x>0)

※ガンマ関数の定義は以下のとおり

\Gamma(x)=\displaystyle\int_{0}^{\infty}t^{x-1}e^{-t}\,dt

期待値

 E(X)=\dfrac{\alpha}{\beta}

分散

 V(X)=\dfrac{\alpha}{\beta ^2}

積率母関数(モーメント母関数)

 E(t^{tX})=(\dfrac{\beta}{\beta - t})^{\alpha}

5. ベータ分布

定義

 α>0, 𝛽>0 とし、確率変数𝑋に対して、以下の確率密度関数をもつ分布をベータ分布という。

確率密度関数

 f(x)=\dfrac{1}{B(\alpha , \beta)}x^{\alpha -1}(1-x)^{\beta -1}

※ベータ関数の定義は以下のとおり

B(\alpha , \beta)=\displaystyle\int_{0}^{1}x^{\alpha-1}(1-x)^{\beta -1}\,dt

期待値

 E(X)=\dfrac{\alpha}{\alpha + \beta}

分散

 V(X)=\dfrac{\alpha\beta}{(\alpha + \beta)^2(\alpha + \beta +1)}

積率母関数(モーメント母関数)

 簡単な式で表せない

6. コーシー分布

定義

 確率変数𝑋に対して、以下の確率密度関数をもつ分布をコーシー分布という。

期待値

 存在しない

分散

 存在しない

積率母関数(モーメント母関数)

 存在しない

7. 対数正規分布

定義

𝑌~N(𝜇, 𝜎^2) のとき、確率変数𝑋=𝑒^𝑌が従う確率分布を対数正規分布という。確率密度関数は以下のとおり。

期待値

 E(X)=\exp(\mu +\dfrac{\sigma ^2}{2})

分散

 V(X)=\exp(2\mu +\sigma ^2)(\exp(\sigma ^2) -1)

積率母関数(モーメント母関数)

 存在しない

8. ワイブル分布

定義

 𝑎>0, 𝑏>0 とし、確率変数𝑋に対して、以下の確率密度関数をもつ分布をワイブル布という。

確率密度関数

 f(x)=\dfrac{b}{a^b}x^{b-1}\exp(-(\dfrac{x}{a})^b)

なお、ワイブル分布は、ガンマ関数における定数λを、以下の式で 𝑥の関数とした場合の分布である。

 \lambda=\gamma(x)=cx^{b-1}, \quad c=\dfrac{b}{a^b}

𝑏=1 のときのワイブル分布は、𝑟(𝑥)=𝑐で一定となり、指数分布になる。

期待値

 E(X)=\alpha\Gamma(\dfrac{b+1}{b})

分散

 V(X)=\alpha^2(\Gamma(\dfrac{b+2}{b}) - \Gamma(\dfrac{b+1}{b})^2)

積率母関数(モーメント母関数)

 簡単な式で表せない

9. ロジスティック分布

定義

 確率変数𝑋に対して、以下の確率密度関数をもつ分布をロジスティック分布という。

確率密度関数

 f(x)=\dfrac{e^{-x}}{(1+e^{-x})^2}

また、ロジスティック分布の累積分布関数は、ロジスティック関数である。

 P(X\le x)=\dfrac{1}{1+e^{-x}}

期待値

 E(X)=0

分散

 V(X)=\dfrac{\pi^2}{3}

積率母関数(モーメント母関数)

 E(t^{tX})=\Gamma(1+t)\Gamma(1-t)

導出方法

多くの参考書において、これらの導出は、数式の途中計算や公式等の前提知識の説明が省略されていることが多いため、理解に時間がかかると感じていました。
前回同様、今回も自分用に整理したものを、動画にしてみました。途中の流れを細かく説明しています。必要に応じてご確認ください。
youtu.be

対策本

統計検定1級/準1級の対策本としては、以下の書籍があります。

こちらの書籍は、検定の範囲内のトピックが幅広く網羅されていますが、数式や解説が省略されている個所が多い印象です。あくまでも、出題範囲のトピックを確認するための用途として使用し、詳細の内容はインターネット等で確認し理解を深めるのが良いと思います。

まとめ

確率分布の期待値・分散・母関数について整理しました。また、導出方法についてまとめた動画および、対策本について紹介しました。
本記事が、統計検定の対策を進める上で、お役に立てば幸いです。