見出し画像

【機械学習の統計学】正規分布と大数の法則とは

今回は正規分布についてアウトプット
していきます。
正規分布は一番基礎となる分布ですので
しっかり覚えていきましょう。

1.正規分布とは

まず正規分布とは何でしょうか。

【正規分布とは】
自然界や人間の行動・性質など様々な現象に
対して、よく当てはまるところから来ている。
グラフは、下図のように左右対称な曲線である。
【正規分布の定義】
①平均μと分散σ2によって分布の形が決まる

②平均値と最頻値と中央値が一致する。
③平均値を中心にして左右対称である。
④分散(標準偏差)が大きくなると、
 曲線の山は低くなり、左右に広がって平らに
   なる。分散(標準偏差)が小さくなると、
   山は高くなり、よりとがった形になる。

画像1

正規分布の定義として一番覚えておきたいのは
平均μと分散σ2によって分布の形が決まるという
ところです。

本当にこんな複雑そうなグラフが自然界に
あるのかと思った方も多いのではないでしょうか。

そこで正規分布の例を紹介します。

【正規分布の例】
・電車が定刻からずれる時間の分布
・ダーツで中心から外れる距離の分布
・日本人の身長の分布
・試験の成績の分布

この様に例をみてみると
何となくイメージできたと思います。

それではなぜ自然界のものが正規分布に
なるのでしょうか?

その根拠は中心極限定理にあります。

中心極限定理については
次回アウトプットしていきます。

中心極限定理の前に大数の法則について
理解していきましょう。

2.大数の法則とは

【大数の法則とは】
データを沢山集めると真の確率に近づき
データが少ないと誤差が大きい
【例】49%の確率で勝てるパチンコ
最初は誤差により勝ち越す確率はあるが
沢山やる事によって49%の確率に近づき
負ける。


それでは事例をもとにみてみましょう。

【事例】
コインを投げた時、表が出る確率は?
・10回コインを投げた時
・100回コインを投げた時
で比較する。

画像2

ご覧の様に標本の数が増えると本来の確率(50%)
に近づいていますね。

よって標本の数が増えると母集団の平均に近づく
という事ができます。

3.大数の法則のポイント

標本数が十分に大きければ観測された
標本平均を母集団の平均(母平均)とみなして良い

【例】
日本人男性の平均身長:170cmとする

街で無作為に声をかけ3人の男性の
身長の平均をとると170cmとは離れます。

しかし日本人男性ほとんどの平均を取れば
170cmに近づいていきます。

よって標本の平均が増えれば母集団の平均に
近づくという事が言えます。

次回は中心極限定理について
アウトプットしていきます。


4.おすすめ書籍

最後に統計学を学ぶ上でお勧めの書籍を
紹介しますのでよろしければこちらも
ご覧ください。

では。

【Follow Me】
INSTAGRAM@shishi_maru.440
Twitter@shishi_maru


では。





よろしければサポートお願いします。