【機械学習の統計学】正規分布と大数の法則とは
今回は正規分布についてアウトプット
していきます。
正規分布は一番基礎となる分布ですので
しっかり覚えていきましょう。
1.正規分布とは
まず正規分布とは何でしょうか。
【正規分布とは】
自然界や人間の行動・性質など様々な現象に
対して、よく当てはまるところから来ている。
グラフは、下図のように左右対称な曲線である。
【正規分布の定義】
①平均μと分散σ2によって分布の形が決まる
②平均値と最頻値と中央値が一致する。
③平均値を中心にして左右対称である。
④分散(標準偏差)が大きくなると、
曲線の山は低くなり、左右に広がって平らに
なる。分散(標準偏差)が小さくなると、
山は高くなり、よりとがった形になる。
正規分布の定義として一番覚えておきたいのは
平均μと分散σ2によって分布の形が決まるという
ところです。
本当にこんな複雑そうなグラフが自然界に
あるのかと思った方も多いのではないでしょうか。
そこで正規分布の例を紹介します。
【正規分布の例】
・電車が定刻からずれる時間の分布
・ダーツで中心から外れる距離の分布
・日本人の身長の分布
・試験の成績の分布
この様に例をみてみると
何となくイメージできたと思います。
それではなぜ自然界のものが正規分布に
なるのでしょうか?
その根拠は中心極限定理にあります。
中心極限定理については
次回アウトプットしていきます。
中心極限定理の前に大数の法則について
理解していきましょう。
2.大数の法則とは
【大数の法則とは】
データを沢山集めると真の確率に近づき
データが少ないと誤差が大きい
【例】49%の確率で勝てるパチンコ
最初は誤差により勝ち越す確率はあるが
沢山やる事によって49%の確率に近づき
負ける。
それでは事例をもとにみてみましょう。
【事例】
コインを投げた時、表が出る確率は?
・10回コインを投げた時
・100回コインを投げた時
で比較する。
ご覧の様に標本の数が増えると本来の確率(50%)
に近づいていますね。
よって標本の数が増えると母集団の平均に近づく
という事ができます。
3.大数の法則のポイント
標本数が十分に大きければ観測された
標本平均を母集団の平均(母平均)とみなして良い
【例】
日本人男性の平均身長:170cmとする
街で無作為に声をかけ3人の男性の
身長の平均をとると170cmとは離れます。
しかし日本人男性ほとんどの平均を取れば
170cmに近づいていきます。
よって標本の平均が増えれば母集団の平均に
近づくという事が言えます。
次回は中心極限定理について
アウトプットしていきます。
4.おすすめ書籍
最後に統計学を学ぶ上でお勧めの書籍を
紹介しますのでよろしければこちらも
ご覧ください。
では。
【Follow Me】
INSTAGRAM@shishi_maru.440
Twitter@shishi_maru
では。
よろしければサポートお願いします。