機械学習

PythonのNumPyライブラリで平均・分散・標準偏差を求めてみた

PythonのNumPyライブラリには、入力データとなる多次元配列(ndarray)の平均・分散・標準偏差を求める関数が用意されている。今回は、入力データ\(x\),\(y\)の値(全20個)の合計・平均・分散・標準偏差を求めてみたので、そのサンプルプログラムを共有する。

なお、入力データを\(x_1\), \(x_2\), …, \(x_n\)とした場合の平均・分散・標準偏差は、以下の公式で求められる。

●平均

平均の公式
出所:統計WEB_平均・中央値・モード

●分散

分散の公式
出所:統計WEB_分散

●標準偏差

標準偏差の公式
出所:統計WEB_標準偏差

入力データの合計・平均は、NumPyのsum関数・mean関数を利用して算出できる。その実行結果は、以下の通り。

実行結果_合計・平均

また、入力データの分散・標準偏差は、NumPyのvar関数・std関数を利用して算出できる。その実行結果は、以下の通り。

実行結果_分散・標準偏差

要点まとめ

  • PythonのNumPyライブラリには、入力データとなる多次元配列(ndarray)の平均・分散・標準偏差を求める関数があり、平均はmean、分散はvar、標準偏差はstdという関数となる。