機械学習

正規分布の計算を行いグラフを描いてみた

正規分布は連続型の確率分布(=確率密度関数)の1つで、世の中の多くの分布が正規分布に従うといわれている。

平均\(μ\)、分散\(σ^2\)の正規分布に従う確率変数\(X\)の確率密度関数\(f(x)\)は、以下の式で表せる。

正規分布の公式
出所:統計WEB_正規分布

例えば、平均\(μ=0\)、分散\(σ^2=1\)の正規分布(=標準正規分布)のグラフを描いた場合の、ソースコードと実行結果は、以下のようになる。

標準正規分布のグラフ

また、平均または標準偏差を変更しながら、正規分布のグラフを描いた場合の、ソースコードと実行結果は、以下のようになる。

様々な正規分布のグラフ



「DesignEvo」は多くのテンプレートからロゴを簡単に作成できるツールだった多くのテンプレートが用意されていてロゴを簡単に作成できるツールの一つに、「DesignEvo」があります。今回は、「DesignEvo」...

さらに、平均\(μ=0\)、分散\(σ^2=1\)の正規分布(=標準正規分布)のグラフに、\(-σ\)~\(+σ\)の範囲(全体の約\(68.3\)%)を色付けすると、以下のようになる。

標準正規分布のグラフ(x=-1~1の範囲を色付け)

また、平均\(μ=0\)、分散\(σ^2=1\)の正規分布(=標準正規分布)のグラフに、\(-2σ\)~\(+2σ\)の範囲(全体の約\(95.4\)%)を色付けすると、以下のようになる。

標準正規分布のグラフ(x=-2~2の範囲を色付け)



ちなみに、上記で色づけした部分の面積の割合は、以下のサイトのような、標準正規分布表から確認できる。
https://www.coronasha.co.jp/np/data/docs1/978-4-339-06128-4_2.pdf

標準正規分布表

上記の標準正規分布表より、\(-σ\)~\(+σ\)の範囲となる確率は、\(z=1.0\)の場合の面積が\(0.3413\)なので、\(0.3413 \times 2\ = 0.6826 ≒ 0.683 = 68.3%\)となり、\(-2σ\)~\(+2σ\)の範囲となる確率は、\(z=2.0\)の場合の面積が\(0.4772\)なので、\(0.4772 \times 2\ = 0.9544 ≒ 0.954 = 95.4%\)となる。

ちなみに、この性質は、平均や分散・標準偏差の値とは関係なく、全ての正規分布のグラフに当てはまる。

要点まとめ

  • 正規分布は連続型の確率分布(=確率密度関数)の1つで、世の中の多くの分布が正規分布に従うといわれている。
  • 平均\(μ\)、分散\(σ^2\)の正規分布に従う確率変数\(X\)の確率密度関数\(f(x)\)は、以下の式で表せる。
    \[
    f(x)=\frac{1}{\sqrt{2π}σ}e^{-\frac{{(x-μ)}^2}{2σ^2}} (-\infty \lt x \lt \infty)
    \]
  • 平均\(μ=0\)、分散\(σ^2\)の正規分布では、\(-σ\)~\(+σ\)の範囲に全体の約\(68.3\)%のデータが、
    \(-2σ\)~\(+2σ\)の範囲に全体の約\(95.4\)%のデータが、それぞれ当てはまる。