【機械学習の統計学】中心極限定理のキモチ
今回は中心極限定理について
アウトプットしていきます。
中心極限定理は記述統計と
推測統計を繋ぐ非常に重要な役割を
持っています。
感覚的にわかりずらい部分もありますが
しっかり学んでいきましょう。
1.中心極限定理とは
中心極限定理の定義はこの様になっています。
【中心極限定理とは】
①標本平均の分布は正規分布に近づく
②母集団の分散をσ2とし母集団からn個の
データを取ったとすると標本分布の
分散はσ2/nになる
①標本平均の分布は正規分布に近づく
について事例を元にみてみましょう。
【例】アジの重さ
母集団:世界中のアジ
標本:母集団から抽出されたデータ
世界中のアジから抽出されたデータ
標本平均:標本の平均をいくつもとったもの
母集団が正規分布ではなくても
標本平均は正規分布に近づきます。
次はこちらについて考えてみましょう。
②母集団の分散をσ2とし母集団からn個の
データを取ったとすると標本分布の
分散はσ2/nになる
まずアジを1匹ずつとりデータを
プロットすると母集団と同じグラフ
の形になります。
(正規分布ではない)
次に母集団から全てのアジ取って
平均を出したら20gになります。
最後に標本平均の分散はσ2/nになり
標本の数が増えると分散は0に近づきます。
【まとめ】
母集団から多く標本をとると分散は0に近づく
標本の数が1であればσ2になる
2.大数の法則と中心極限定理まとめ
それでは今まで学んだ大数の法則と
中心極限定理についてまとめていきましょう。
【前提】
母集団と標本平均の分布の関係において
母集団の平均がμ分散がσのとき
【まとめ】
①大数の法則
・標本の数が多いと標本平均はμに近づく
②中心極限定理
・標本の数をnとすると標本平均の
分布の分散σ/2になる
【分かる事】母集団と標本の関係が分かる
①母集団の分散が分かれば標本平均の
データの数によって標本平均の分散・
標準偏差が分かる
②標本平均の分散が分かれば母集団の
分散が分かる
3.おすすめ書籍
最後に統計学を学ぶ上でお勧めの書籍を
紹介しますのでよろしければこちらも
ご覧ください。
では。
【Follow Me】
INSTAGRAM@shishi_maru.440
Twitter@shishi_maru
よろしければサポートお願いします。