艦これの検証を見るための統計のお勉強のまとめ

大学で統計習ったけど、全く覚えてない人のまとめなので、話半分でお願いいたします。
間違ってたら教えていただけるとめっちゃうれしいです

1.件数が少ない場合(2項分布っていうらしい)

ある事象p%の確率で起こると仮定する。
その事象がn回の試行回数中x回起こった。この確率は

$$
{}_n C_x\times p^x \times (1-p)^{(n-x)} 
$$

である。
同様に「p%の確率で起こるある事象がn回の試行で起こる回数がx回以下」である確率は

$$
\sum_{0\le k\le x}{}_n C_k\times p^k \times (1-p)^{(n-k)} 
$$

である。
この確率が十分に低ければ、p%で発生する事象がn回中x回起こる可能性はほとんどないため、p%であるという仮定が間違っていた可能性が高くなる。
つまり、この事象の発生率はp%未満ではないかと考えられる。

2.件数が多い場合
上の式でnが十分に大きいと

$$
{}_n C_x\times p^x \times (1-p)^{(n-x)} 
$$

がめちゃくちゃ小さくなってまともに計算できない。

なので近似を使う。
2項分布はnが十分に大きいと次の関数に近似できる

$$
f(x)=\frac{1}{\sqrt{2π}σ}e^{(\frac{-(x-μ)^{2}}{2σ^2})}
$$

$$
μ=np
$$

$$
σ=\sqrt{np(1-n)}
$$

また、この関数は、μ=0、σ=1の関数に変換できる。

$$
f(x)=\frac{1}{\sqrt{2π}}e^{(\frac{-x^{2}}{2})}
$$

この関数は以下のようなグラフになる。

このグラフの1.96より大きい部分を合計すると2.5%になる。(右側の赤の部分)xも変換すると

$$
\frac{x-μ}{\sqrt{\frac{σ^2}{n}}}
$$

になる。よって、

$$
-1.96\leq\frac{x-μ}{\sqrt{\frac{σ^2}{n}}}\leq1.96
$$

のとき、p%という仮定が正しい可能性が95%であるといえる。

3.信頼区間

上の式を変換すると以下のようになる。

$$
x-1.96\times\sqrt{\frac{σ^2}{n}}\leqμ\leq x+1.96\times\sqrt{\frac{σ^2}{n}}
$$

ここでnが十分に大きい場合、pは

$$
\frac{x}{n}
$$

とほぼおなじになるはすなので、置き換えて上記の式を計算すると、
n回試行してx回成功した場合、その確率は上記の範囲にある可能性が95%以上といえるらしいです。

この記事が気に入ったらサポートをしてみませんか?