見出し画像

【機械学習の統計学】二項分布とベルヌーイ試行とは

今回はデータの分布について
アウトプットしていきます。

今後、大数の法則中心極限定理を理解
していく為にはデータの分布について
学んでいく必要があります。

そこで今まで学んだ確率の考え方を使い
ながら二項分布について理解していきましょう。

1.二項分布とは

二項分布とは
ベルヌーイ試行をn回行って、
成功する回数xが従う確率分布の事

ここでベルヌーイ試行という聞き慣れない
言葉が出てきましたがとても身近で簡単な
ものです。

ベルヌーイ試行とは
「成功か失敗か」「表か裏か」「勝ちか負けか」
のように2種類のみの結果しか得られないような試行

コイン投げをイメージするととても
理解しやすいですね。

それでは事例を元にもう少し詳しく
見てみましょう

【事例】
緑と白の2枚のカードがある
この2枚のカードを順番に3回引く
緑のカードが2回出る確率を求める。

まず始めに2枚のカードをとった時
どの様なパターンがあるのでしょうか。

画像1

この様になります。

図の解説
一番左の図:3回引いた時のパターン
真ん中の図:上記を並べてみた
一番右の図:見易い様並び変える

それでは緑のカードが2回出る確率を
計算してみましょう。

画像2

この様になります。

【解説】
緑と白のカードを3回引いた時
全パターン:8通り
緑のカード が2回出る回数:3回

よって答えは3/8になります。


2.二項分布をグラフでみてみよう!

それでは先ほど計算した事例をベースに
二項分布をヒストグラムというグラフで
みてみましょう。

ヒストグラムとは
グラフで度数分布を表すもので視覚的に理解
し易くなる

先ほどはカードを3回引いたパターンでしたが
今回はカードを4回引いたパターンの計算です。

画像3

このグラフから読み取れるのは
・カード4枚の色が揃う①と⑤は確率が低い
・カードの色が2枚ずつの③が一番確率が高い

この様な事が分かります。

次は先ほどまでと少し違う事例を元に
考えてみましょう。

【事例】
じゃんけんで勝率60%の人が
50回戦った時の少数の確率分布を求める

これをグラフにするとこの様に
なります。

画像4

表にするとこの様になります。

画像5

グラフを見ると直感的にも理解できる
様に50回中30回勝つ確率が一番高く
なっています。

いかがでしょうか。

なんとなく理解できましたか?

もし理解しづらければもう一度最初から
見ていただければと思います。


3.おすすめ書籍

最後に統計学を学ぶ上でお勧めの書籍を
紹介しますのでよろしければこちらも
ご覧ください。

では。

【Follow Me】
INSTAGRAM@shishi_maru.440
Twitter@shishi_maru



よろしければサポートお願いします。