見出し画像

クジ引きのケーススタディ


たまたまクジ引きの当選確率について計算する必要があったので、そのメモです。

検討する事例

この記事では次のような設定のクジ引きを考えます。

A賞からG賞まで次の確率で当選し、それ以外(ハズレ)はない。ただしA賞の当選上限は25点である。A賞以外には景品の在庫に上限はない。C賞からG賞までは賞の中でもそれぞれ5種類の景品があり、どれが当たるかは決まっていない(それぞれの賞の中で等確率とする)。

$$
\begin{array}{l r}
賞 & 確率 \\ \hline
A賞 & 0.5\% \\ \hline
B賞 & 0.5\% \\ \hline
C賞 & 0.8\% \\ \hline
D賞 & 13.5\% \\ \hline
E賞 & 20.5\% \\ \hline
F賞 & 27.5\% \\ \hline
G賞 & 36.7\% \\ \hline
合計 & 100\% \\
\end{array}
$$

つまり例えばC賞は実際にはC1賞からC5賞までが存在し、それぞれ0.16%の確率が割り当てられていると考えることもできます。

A賞にしか興味がない場合

ここで、A賞が並外れてリターンの大きい賞で、他はそれほどでもない、したがってA賞を当てることにしか興味がないという場合を考えましょう。この場合は話がとても単純になり、「すごく不公平なコイン(50%-50%ではなく、0.5%-99.5%の)を使ったコイン投げ」と同じになります。

当選確率が0.5%とはどういうことか

この場合「当たり」の確率が0.5%になりますが、まずは当たる確率が0.5%とはどういうことなのか考えてみましょう。0.5%は200分の1ということになります。このように考えると下図のようなイメージを持ってしまいがちです(赤が当たりとします)。

0.5%を200回に1回と考えた場合にありうる事例

つまりクジ引き200回ずつの区画があり、その区画の中にそれぞれ当たりが1つ入っている……というような。ところで何故さっき0.5%を「200分の1」としたのでしょうか。それは通分した分数であるというだけで、別に0.5%を「400分の2」と見做してもよかったはずです。そうすると下図のようなケースを考えても確率0.5%の事例としてはありうるということになります。どこに当たりが現れるかはランダムで、0.5%ということだけが決まっているからです。

0.5%を400回に2回と考えた場合にありうる事例

勿論200ではなく400が正しいというわけではなく、そもそもそのような「区画」があるとは考えないというのが適切です。

A賞を当てるには何回クジを引けばいいのか

上のように考えると「A賞欲しい……そうだ200回クジを引けばいいんだ!」という考え方が妥当でないことがわかります。また、これは在庫に上限のないクジなので「全部一人で買い占めれば必ず当たる」ということはありません。B以下の賞も無限にあるので、いつまでもそれらが当たり続けることがありえます。

というわけで、問いを変えて「クジを何回引くことにすればA賞の当たる確率をどの程度まで上げられるのか」という問いにしましょう(いったんA賞当選上限数のことは無視します)。1回ならば0.5%です。これを自分が十分だと感じる確率に高めるには何回引く見通しになるのか。クジを引く回数をNとしたとき、これは試行回数をN、確率を0.005とする二項分布に従います。これはExcelとかで計算できます。

試行回数をN、確率を0.005とする二項分布

クジを10連で弾くと当選0の確率は95.1%になります。この意味は、沢山の人が10連のクジを引いたと仮定したとき、そのうち20人あたり19人がハズレのグループに入り、20人あたり1人が当選のグループに入ります。0.5%に比べると約10倍にあがりました。じゃあもっと回数を増やしたらどうでしょうか。

クジ引きの回数を200回にした場合、当選数0の確率は36.7%になります。思ったより0%に近づかないんですね。この意味は、沢山の人が200回ずつクジを引いたと仮定したとき、そのうち3人に1人くらいはハズレのグループに入り、3人に2人が当選のグループに入ります。この確率は高いでしょうか、低いでしょうか。同様にしてクジを引く回数を600回にすると当選0の確率は4.9%まで下げられます。

景品の重複当選の確率

設定が面倒くさいので時間があって気が向いたら書きます。

この記事が気に入ったらサポートをしてみませんか?