見出し画像

毎日統計13

毎日少しずつ勉強を続けて統計検定2級合格を目指すこちらのコーナー。あくまで個人的な学習ノートなので分かりやすい解説はありません。

さて、今日もこちらの教材を読み進めます。

今回は第6章。これまで学んできた確率分布を実際の統計分析に適応するため、実例に照らし合わせつつ代表的な確率分布を紹介している。

超幾何分布

2種類のA,BからなるN個の集団から勝手にn個を取り出したときの確率分布の分布である。この確率分布はM,N,x,nを用いて組み合わせの計算で与えられる。また、取り出すときにそれを復元するのか、それとも非復元で考えるかの2通りがあるが、超幾何分布で対象とするのは非復元の場合のみである。復元の場合は次の二項分布になる。

この超幾何分布は、湖の中の魚の個体数を推定するなどの、捕獲再捕獲法の問題で用いられる。

これは、上記で述べたM,N,x,nの変数のうち、Nだけが不明であとは制御できる変数である場合にNを推定するのに役立つ。

なるほど。これは便利だ。ただ使える対象は、魚のように集団を捕獲してまた集団に戻したあと、再捕獲までに十分に混ぜ合わせられる必要があるが…

二項分布とベルヌーイ分布

2種類の結果が観測可能且つそれが独立で前後の関連がないような試行をベルヌーイ思考と呼ぶ。この時の確率分布を二項分布と呼ぶ。またの名をベルヌーイ分布とも呼ぶ。前節の超幾何分布とは復元性の違いがあるが、これを近似することも可能。

二項分布は有りか無しかの二パターンしかない結果がない場合などに使えるので、実世界での適用例が多い。検定などによく用いられるらしい。

ポアソン分布

二項分布において、観測回数nが膨大であり、片方の結果が観測される確率pが極めて小さい場合には先ほどの二項分布に基づく確率分布は、例えばp=0.00002などである場合などは計算が極めて煩雑になり現実的ではない。このような場合、n*pが何かしらの定数λに落ち着くと仮定することで、確率を指数関数に近似できるポアソンの少数の法則ならびに、ポアソン分布に当てはめることができる。

ちなみにポアソン分布における期待値も分散もλになる。二項分布の期待値と分散においてnp→λ且つ1-p→1となることからも簡単に出せる。

ポアソンは確か、戦場で馬に蹴られて死ぬ確率を表現するという中世では重要な、現在では限りなくニッチな問題に対するアプローチで考えられたと聞く。現在では似たように事故に遭う確率だったり、不動産などの高額商品の成約などの推定に使われているそうな。

幾何分布と負の二項分布

超が付いていないので、限界を超えてないのかなと思うがそういうサイヤ人的な話ではない。

これも二項分布の派生で、試行回数を定めず、最初に成功の結果が出るまで続ける、と言ったような場合を対象にした確率分布である。時間経過を1,2,3...と離散的に数える場合にも使われるため、待ち時間分布とも呼ばれる。

例えば、地震のような災害が0.04の確率で起きる時、平均的に何年後にこれが起きるか?というようなものの予測に使われる。

またこの幾何分布を一般化し、k回の成功をあるまでのx回の失敗回数と定義した時、負の二項分布というものが得られる。

二項分布と負の二項分布、ポアソン分布と似ているものの若干使い所が違うので要注意。

一様分布

最後はサイコロのようにどの結果も同じ確率で出る、というような場合の確率分布を一様分布と呼ぶ。


本日はここまで。今日学んだ中だと利用価値や近似の美しさ、歴史的情報が面白いポアソン分布が好きだった。

途中まとめてて気がついたが、これまでの話は状況が離散的である場合に使えるもので、似たような状況でも連続の場合は定義や名前が異なるようだ。明日はその辺りを学ぼうと思う。











この記事が気に入ったらサポートをしてみませんか?