ガチャコンプの確率と期待値について
どんな界隈でも、オタクはガチャがあればコンプしたがるものです。
そこで、どのくらいの回数ガチャを引けばコンプできるのか、期待値について調べました。
また、確率について式を立てて求めたので備忘録としておきます。後半は読まなくてもいいです。
期待値というのは、大雑把に言えばコンプできる試行回数の平均値なのですが、その回数だけ引けばコンプできるというわけではありません。
実際には、期待値は次の値になります。
証明は省略します。
具体例として、6種類のガチャの場合は次のようになります。
6種のガチャで15回くらいが引く回数の目安になるようです。
ただし、15回までにコンプできる確率は64.421%になります。
また、コンプできる確率が95%を超えるのは27回(95.659%)となります。
先日、ラッコのリロくんが16歳になり、記念に16種類の缶バッジガチャが設けられました。(1回200円)
16種類の場合で同様に求めると期待値は54.09回となります。
こちらの場合、コンプできる確率が95%を超えるのは90回(95.269%)となります。
200×90=18,000円、百円玉180枚くらいあると安心ですね。
(投稿日時点でまだガチャ設置されてるそうなので回してみましょう)
以下ではただの確率論(高校数学程度?)を書きます。
もっとエレガントな方法がきっとあると思いますが、愚直に行きます。
求めたいものは、$${m}$$種類のガチャを$${n}$$回引いた時点で、$${k}$$種類そろっている確率$${p(m,n,k)}$$。ただし$${1\leqq k \leqq m}$$とします。また、$${n}$$回引いて初めて$${k}$$種類そろう確率ではありません。
具体例として、$${m=4, n=6}$$、すなわち4種類のガチャを6回引く場合を考えます。
すべての並べ方は$${4^6=4096}$$通り。
1種類だけそろう場合。
4種類から1種類を選ぶ選び方は$${_{4}C_{1}=4}$$通り。
並べ方は1通り。
よって確率は、
$${p(4,6,1)=\frac{4\times 1}{4096}=\frac{1}{1024}}$$
2種類だけそろう場合。
2種類の選び方は$${_{4}C_{2}=6}$$通り。
並べ方は、いずれか1種類のみの並べ方の場合を除く為、$${2^6-2=62}$$通り。
よって、
$${p(4,6,2)=\frac{6\times 62}{4096}=\frac{93}{1024}}$$
3種類だけそろう場合。
選び方は$${_{4}C_{3}=4}$$通り。
ここで選んだものを仮にA,B,Cと名付ける。
並べ方について。
A,B,Cの3種を重複を許して並べる並べ方は$${3^6=729}$$通り。
このうち、[A,B],[B,C],[C,A]のみで構成されている並べ方が、それぞれ62通り存在し、2種のみの並べ方は$${3\times62=186}$$通り。
さらに、[A],[B],[C]のみで構成されている並べ方がそれぞれ1通り存在し、1種のみの並べ方は3通り。
従って、並べ方は
$${729-186-3=540}$$通り。
よって確率は
$${p(4,6,3)=\frac{4\times540}{4096}=\frac{135}{256}}$$
4種類そろう場合。
選び方は1通り。
並べ方について。
4種を重複を許して並べる並べ方は$${4^6=4096}$$通り。
3種類のみになる並べ方は$${_{4}C_{3}\times540=2160}$$通り。
2種類のみになる並べ方は$${_{4}C_{2}\times62=372}$$通り。
1種類のみになる並べ方は$${_{4}C_{1}\times1=4}$$通り。
従って、並べ方は
$${4096-2160-372-4=1560}$$通り。
確率は、
$${p(4,6,4)=\frac{1\times1560}{4096}=\frac{195}{512}}$$
検算をすると
$${\frac{1}{1024}+\frac{93}{1024}+\frac{135}{256}+\frac{195}{512}=1}$$
確率の和が1になっているのでどうも正しそうだ。
並べ方が鍵らしい。
そこで、$${n}$$回の試行で$${k}$$種類でるときの並べ方を$${a_{n}^{k}}$$と書くことにする。
$${a_{n}^{1}=1}$$
$${a_{n}^{2}=2^n-2}$$
$${a_{n}^{3}=3^n-_{3}C_{2}\cdot(2^n-2)-_{3}C_{1}\cdot 1\\ =3^n-(_{3}C_{2}\cdot a_{n}^{2}+_{3}C_{1}\cdot a_{n}^{1})}$$
このことから、一般の場合も次のように書ける。
$${a_{n}^{k}=k^n - \sum_{l=1}^{k-1}}$$ $${_{k}C_{l}a_{n}^{l}}$$
この$${a_{n}^{k}}$$を使うと、
$${p(m,n,k)=\frac{_{m}C_{k}a_{n}^{k}}{m^n}}$$と書けることから、式を変形すると(途中式略)
$${p(m,n,k)=\frac{k^n\cdot_{m}C_{k}}{m^n}-\sum_{l=1}^{k-1}\frac{_{m}C_{k}\cdot_{k}C_{l}}{_{m}C_{l}}\cdot p(m,n,l)}$$
と書ける。
ただし、
$${p(m,n,1)=\frac{1}{m^{n-1}}}$$
長々と書きました。
手作業では難しいのでExcelで計算させた結果が上のグラフです。
最後までお読みくださりありがとうございました。