確率分布について(離散型)

今度こそは確率分布について説明します。前回確率分布についての基礎解説をしましたのでこちらをご覧ください。これらの知識を前提として説明していきます。

では確率分布の種類からやっていきます。タイトルにある通り離散型と連続型でそれぞれ扱う分布が違います。またデータを扱う

では簡単に離散型と連続型の確率分布を紹介します。

ではまず離散型から

・超幾何分布
・二項分布(ベルヌーイ分布)
・ポアソン分布
・一様分布
・負の二項分布
・幾何分布

続いて連続型の確率分布について

・正規分布
・指数分布
・ガンマ分布
・ベータ分布
・一様分布
・コーシ分布
・パレート分布
・ワイブル分布

では早速離散型の確率分布について一つ一つ見ていきましょう。

・二項分布

Wikipediaによると

数学において、二項分布(にこうぶんぷ、英: binomial distribution)は、結果が成功か失敗のいずれかである試行(ベルヌーイ試行と呼ばれる)を独立に n 回行ったときの成功回数を確率変数とする離散確率分布である。

https://ja.m.wikipedia.org/wiki/%E4%BA%8C%E9%A0%85%E5%88%86%E5%B8%83

というように結果が二つである際に使用されます。例えばコインを100回投げて60回表になる確率などを表しています。

Wikipediaの説明にベルヌーイ試行とありますが、これは試行を一回だけやった時の試行を指します。分布は次のようになります。こちらはコインを投げて表が出る確率を表した分布です。0回である確率が大体0.2位でみたいな感じで見ることができます。右上のβはβ(n,p)とがもとの形です。今回は試行回数が5回なのでnが5、0.1は確率を表しています。

画像1

・ポアソン分布

次に紹介するのがポアソン分布です。

ポアソン分布自体は二項分布と似ています。どこが違うのかと言うと試行回数がより多く、かつ確率pが低い点です。

どのような場面で使われるかと言うと飛行機の事故や火災件数、遺伝子の突然変異など滅多に起こらないような場面ある時間の間にある特定のイベントが起こる確率を求めたいと言う場面で使用されます。一年で何回兵士が馬に蹴られて死ぬかというのが歴史上で最初に使われたとされています。

下のグラフがポアソン分布を簡単に表した物です。λと言うのが平均で何回起こるかと言うのを指しています。(今回は大体で設定しています。)

画像2

・幾何分布

次に紹介するのが幾何分布です。Wikipediaのよると、二つの定義があるようです。

・ベルヌーイ試行を繰り返して初めて成功させるまでの試行回数 X の分布。台は {1, 2, 3, …}.
・ベルヌーイ試行を繰り返して初めて成功させるまでに失敗した回数 Y = X − 1 の分布。台は {0, 1, 2, 3, …}.

https://ja.m.wikipedia.org/wiki/%E5%B9%BE%E4%BD%95%E5%88%86%E5%B8%83

ある事象が生じる確率が0.4だったした際に、また再度起こるのは平均的に何年後かといった時や10年以内に起こる確率はどれくらいかといった場面で使用される際が多いです。またの名を待ち時間分布とも呼びます。

下記のグラフが幾何分布です。サイコロを降った際にある目が出る確率を例に取ると回数が増えればその目が出やすくなると思います。何回か振ればその目が出るはずですよね。(メモリがずれていますが気にしないでください。)

画像3

・超幾何分布

次に紹介するのが名前の似た超幾何分布です。何かすごいのかなと思うかもしれません。こちらも毎度お馴染みのWikipediaで定義を見てみます。

超幾何分布(ちょうきかぶんぷ、英: hypergeometric distribution)とは、成功状態をもつ母集団から非復元抽出したときに成功状態がいくつあるかという確率を与える離散確率分布の一種である。男女・合否などのように2種の排他的属性に分割できる有限母集団からの非復元抽出に適用される。超幾何分布と対照的[1]な確率分布には二項分布がある。

https://ja.m.wikipedia.org/wiki/%E8%B6%85%E5%B9%BE%E4%BD%95%E5%88%86%E5%B8%83

復元やら非復元と述べられていますが、これは取り出したものを戻すかどうかと言うことを指しています。

この分布が使用される場面として主に資源調査が挙げられます。湖にいる魚の数を推定したい際に予めM匹かサンプルを取って、それらに目印をつけて湖に戻し再度N匹ほど魚を取ってA匹印をつけた魚が含まれていました、と言う感じです。これを捕獲再捕獲法と言います。

実はこの分布は二項分布とポアソン分布と近い分布を取ります。母集団の数より大きくなればなるほど二項分布に近づき、標本数(先程で言うM)が多いほどポアソン分布に近似します。

・負の二項分布

次に紹介するのが負の二項分布です。最初に二項分布を紹介しましたが、何が違うのでしょうか。Wikipediaによると次のように説明されています。

負の二項分布(ふのにこうぶんぷ、英: negative binomial distribution)は、離散確率分布の一つ。確率 p で成功する独立なベルヌーイ試行が繰り返された時の成功回数の分布を表すという意味で二項分布によく似ているが、負の二項分布では試行回数があらかじめ決められておらず、r 回の失敗が起こるまで試行が続けられる。たとえば、コインを 5 回投げた時に表が出る回数は二項分布に従うが、5 回表が出るまでコインを投げ続けた時に裏が出る回数は負の二項分布に従う。

https://ja.m.wikipedia.org/wiki/%E8%B2%A0%E3%81%AE%E4%BA%8C%E9%A0%85%E5%88%86%E5%B8%83

負の二項分布は別名パスカル分布とも呼ばれていて、幾何分布を一般化した分布です。(一回をk回)先程の幾何分布では初めて(一回)サイコロの6が出る確率分布を表していましたが、これを2回だったりk回にしたものが負の二項分布です。

今回はこれで以上です。次回は連続型の確率分布についてみていきます。

この記事が気に入ったらサポートをしてみませんか?