見出し画像

「トリガーの期待値1枚」ってつまりどういう事?

はじめに

こんにちは、くりりんです。

デュエプレをはじめ、ゲームやカードゲームを遊んでいると「期待値」という言葉をよく見聞きしますよね。

例えば「サイコロ出る目の期待値は3.5だ」とか、デュエプレ(やデュエル・マスターズ)で「デッキ40枚中に8枚シールドトリガーを入れればシールドに埋まるトリガーの期待値は1枚だ」

という文言は目にしたことがあったり、知っている方も多いのではないでしょうか。実際上記のような例の期待値計算はかなり単純で、自分で計算できるという方も多いのではないかと思います。

しかし、「じゃあこの期待値って何を意味してるの?」とか「期待値から何がわかるの?」と言ったことを考えようと思うとこれは少し難しい話になってきます。

実際にカードゲームに期待値の考え方を活かしたい!と思うなら、期待値の計算ができることはもちろん、その計算した期待値の解釈の仕方も知っておかないと物足りないですよね。

この記事では大まかに、

・期待値の定義

・期待値の計算

・期待値は何を表しているのか、期待値をどう解釈すればいいのか

の三つを具体例をあげながら説明し、最終的にはデュエプレ(やデュエル・マスターズ)におけるシールドトリガーの枚数の期待値やその解釈の仕方について学んで行きます。

どなたにでも読んでいただきたいですが、前提知識として高校数学の知識があればスムーズに読むことができると思います。

(今回は基本的には離散的な確率分布に絞って話を進めることにします)

確率変数の期待値

はじめに、そもそも期待値とは何かということをはっきりさせておきましょう。そのために、まず確率変数というものについて説明します。期待値は、この確率変数に対して定義されます

ある試行を行う時、その試行の結果全体の集合を標本空間といい、よく$${\Omega}$$などと表します。そしてこの標本空間の元に対して数を対応させる関数を確率変数と言います。(確率的に値を変える数ということで確率変数という名前がついていますが、その実態は関数です)

また確率変数$${X}$$のとりうる値のそれぞれが、いくらの確率で現れるかということは、$${X}$$の値域(取りうる値全体の集合)$${Im X}$$の元に対して区間$${[0,1]}$$の元を対応させる関数$${P_X}$$で表現でき、この関数$${P_X}$$をXの確率分布と呼びます

例えば、サイコロを一回振るという試行を考えましょう。確率変数Xを、出た目の値と定めた時、Xの値域は$${Im X=}$${$${1,2,3,4,5,6}$$}で、確率分布$${P_X}$$は

$${P_X(1)=P_X(2)=P_X(3)=P_X(4)=P_X(5)=P_X(6)=\frac{1}{6}}$$

となります。

この確率的に様々な値をとる確率変数Xが、平均的にどれくらいの値を取るかの指標として、$${X}$$の期待値$${E[X]}$$という量が次のように定義されます。

$${E[X]=\sum_{x\in Im X}xP_X(x)}$$

(確率変数のとりうる値とその値が現れる確率をかけて足し算すれば良いということですね)

例えば上のサイコロの例だと出る目の値$${X}$$の期待値は

$${E[X]=\sum_{x\in Im X}xP_X(x)\\=1\times\frac{1}{6}+2\times\frac{1}{6}+3\times\frac{1}{6}+4\times\frac{1}{6}+5\times\frac{1}{6}+6\times\frac{1}{6}\\=3.5}$$

と計算できますね。

このサイコロの目のように、全ての値が同じ確率で現れるような確率変数では、一般的に言われる「平均」と同じような計算になり、期待値の気持ちや有り難みがわかりにくいので、もう一つ別の例を考えて見ましょう。

先ほどの例のように全ての目が同じ確率で出るようなサイコロが理想的なサイコロですが、実際に市販されているサイコロは、重心が中心からずれる等の理由によってそれぞれの目のでる確率がわずかに異なるようです(1から6まで目のでる確率は均等なのか?)。では例えば出る目の確率分布が次のようになっているサイコロがあったとしましょう。(実際はこんなに大きくずれませんがあくまで説明のための例としてあげます)

スクリーンショット 2022-03-07 3.03.13

このサイコロを振った時、「先ほどの理想的なサイコロよりも大きな値が出ることが期待できそう」という気持ちが湧きますよね。期待値はその気持ちをしっかりと反映してくれます。

実際、出得る目の単純な平均値だと

$${\frac{1+2+3+4+5+6}{6}=3.5}$$

で理想的なサイコロと変わらない値となってしまいますが、期待値は

$${1\times\frac{1}{12}+2\times\frac{1}{6}+3\times\frac{1}{6}+4\times\frac{1}{6}+5\times\frac{1}{6}+6\times\frac{1}{4}\\=\frac{47}{12}\\ \approx 3.9}$$

と、理想的なサイコロの出る目の期待値3.5より大きくなります。

このように期待値は、確率的に値が変わる量(確率変数)が取る値の(ある種の)平均的な値を表す量といえます。

期待値の線形性

シールドトリガーの枚数の期待値を計算してみる前に、その準備として期待値の持つ便利な性質(線形性)について見ておきましょう。ここは証明は省略して結果だけをパパッと説明します。(証明自体は$${Im X}$$の元が可算個の(確率分布が離散的なグラフになる)時の場合であれば高校生でも十分理解できると思います。$${Im X}$$が非可算無限個の要素を持つ(確率分布が連続的なグラフになる)時などの一般の場合に関しては足し算が(ルベーグ)積分になり、本質的には同じですが少し高級な数学が必要になります。それでも気持ちを理解する程度なら難しくないので興味があれば調べてみてください)

期待値の線形性

確率変数$${X,Y}$$、定数$${a,b}$$に対して

$${E[aX+bY]=aE[X]+bE[Y]}$$

が成り立つ。

(一つ強調しておきたいのは、これは$${X}$$と$${Y}$$が独立でなくても成り立つ性質であるということです。)


例えば二つの理想的なサイコロを投げた時の出る目の合計値を$${X}$$としましょう。このXは2から12の自然数値を取るため、期待値を計算するには確率分布$${P_X(2),P_X(3),P_X(4),...,P_X(12)}$$を計算する必要があり、大変です。

しかし、ここで投げる二つのサイコロそれぞれの出る目を$${X_1,X_2}$$とすると$${X=X_1+X_2}$$であるため、

$${E[X]=E[X_1+X_2]\\=E[X_1]+E[X_2](∵期待値の線形性)\\=3.5+3.5\\=7}$$

と簡単に計算できてしまいます。(と大げさに言っていますが、「当たり前じゃん」と感じる人も多いかもしれません)

シールドトリガーの枚数の期待値を計算してみよう

では準備が整ったので実際にシールドに埋まっているシールドトリガーの枚数の期待値を計算して見ましょう。

40枚中割合$${p}$$でシールドトリガーが入っているデッキを使うとします(つまり$${40p}$$枚のシールドトリガーが入っている)。このデッキを用いて対戦を行う時、確率変数$${X}$$を(セットした5枚のシールドの中のシールドトリガーの枚数)とします。この時$${X}$$の期待値$${E[X]}$$は元々の期待値の定義にしたがうと

$${E[X]=\sum^5_{x=0}xP_X(x)}$$

となりますよね。

しかしこの具体的な値を求めるためには各$${P_X(x)(x=0,1,2,3,4,5)}$$の値を計算する必要があり、これが少々面倒です(とは言ってもそこまで大した計算ではないですが)。

スクリーンショット 2022-03-07 3.54.28

そこで今回は、先ほど説明した期待値の線形性を利用して、楽にかつ直感的にも納得しやすい方法で計算してみましょう。

そのためにまず確率変数$${X_i(i=1,2,3,4,5)}$$を以下のように定義します。

左から$${i}$$番目のシールドがシールドトリガーなら$${X_i=1}$$,そうでないなら$${X_i=0}$$

この時シールドトリガーの枚数$${X}$$は

$${X=\sum^5_{i=1}X_i}$$

で表されますよね。

この確率変数$${X_i (i=1,2,3,4,5)}$$の確率分布$${P_{X_i}}$$は

$${P_{X_i}(0)=1-p,P_{X_i}(1)=p}$$

と、こちらは計算するまでもないほど簡単にわかります。

これにより、

$${E[X_i]=p\times 1+(1-p)\times 0=p}$$と計算できるので、先ほどの期待値の線形性を用いて

$${E[X]=E[\sum^5_{i=1}X_i] \\ =\sum^5_{i=1}E[X_i](∵期待値の線形性) \\=5p}$$

と簡単に求めることができました。

スクリーンショット 2022-03-07 0.54.01

これは大雑把にいうと「シールドの中のトリガーの枚数の割合が、デッキ全体のシールドトリガーの割合と同じであることが期待できる」ことを表しており、直感的にも納得しやすいのではないでしょうか。

つまりシールドトリガーの枚数の期待値は

$${5\times}$$(デッキの中のシールドトリガーの割合)

で計算することができます。

例えばデッキ40枚のなかにシールドトリガーが8枚入っていればデッキの中のシールドトリガーの割合$${p}$$は$${\frac{1}{5}}$$なので、シールドトリガーの枚数の期待値は1ということになりますよね。

ちなみにデッキ40枚のなかにシールドトリガーが8枚入っている時、5枚のシールドの中のシールドトリガーの枚数$${X}$$の確率分布$${P_X}$$は実際に計算してみると

$${P_X(0)=\frac{25172}{82251},P_X(1)=\frac{35960}{82251},P_X(2)=\frac{17360}{82251},P_X(3)=\frac{3472}{82251},P_X(4)=\frac{280}{82251},P_X(5)=\frac{7}{82251}}$$

となり、$${X}$$期待値を元々の定義通り計算すると

$${E[X]=\sum^5_{x=0}xp_X(x)\\=0\times\frac{25172}{82251}+1\times\frac{35960}{82251}+2\times\frac{17360}{82251}+3\times\frac{3472}{82251}+4\times\frac{280}{82251}+5\times\frac{7}{82251}\\=1}$$

と計算でき、期待値の線形性を用いて計算した結果と確かに一致していますね。余裕があれば確認してみてください。(少々出てくる値は大きくなりますが学校の教科書に載っているのと同じような問題なので落ち着いて考えれば中学生の方等でも計算できると思います)

これで、シールドトリガーの枚数の期待値を計算はできるようになりました。ではここからは、この期待値をどう解釈すれば良いかを考えて行きましょう

期待値は「期待」できる?

期待値は確率分布(やそれによって特徴付けられる確率変数)の特徴を表す一つの指標になるとは言っても、やはり確率分布をたった一つの値で表現するのには限界があります。

例えば、次のような確率分布で定まる確率変数があるとしましょう。

スクリーンショット 2022-03-07 7.12.01

この確率変数の期待値をここに書き込むと下図のようになります。

スクリーンショット 2022-03-07 7.11.46

この時確率変数はだいたいその期待値周辺の値を取ると言って良いでしょう。

しかし次のような確率分布を持つような確率変数があったとしましょう。この確率変数の期待値もまた5となりますが、この確率変数が取る値(1もしくは9)の指標として、この期待値(5)が適切であるとはいえなさそうですよね。少なくともこの確率変数が期待値付近の値をとることは「期待」できません。

スクリーンショット 2022-03-07 7.09.38


このように、やはり期待値だけでは確率変数の特徴を完全に表現することはできません。そこで期待値以外にも、確率変数の特徴を表す量として分散歪度尖度などといった量が使われます。この中でも特によく出てくる分散について紹介しておきます。

確率変数$${X}$$の分散$${Var[X]}$$は$${\mu=E[X]}$$として、次のように定義されます。

$${Var[X]=E[(X-\mu)^2]}$$

これは大雑把に言えば、値が期待値のまわりにどれだけバラつくかを表しています。

つまり分散の小さい確率変数ではだいたい期待値周りの値が現れることが「期待」できるが、分散の大きい確率変数では必ずしもそうとは言えないということです(かなり曖昧で怪しい表現ですが)。

スクリーンショット 2022-03-07 4.23.43


ではシールドトリガーの枚数の期待値はどうでしょうか。任意の場合で考えるのは面倒なので先ほどと同様に、デッキ40枚中8枚シールドトリガーが入っている場合で考えましょう。この時シールドトリガーの枚数Xの確率分布$${P_X}$$は先ほど示したように、

$${P_X(0)=\frac{25172}{82251},P_X(1)=\frac{35960}{82251},P_X(2)=\frac{17360}{82251},P_X(3)=\frac{3472}{82251},P_X(4)=\frac{280}{82251},P_X(5)=\frac{7}{82251}}$$

であるので、グラフにすると概形は下図のようになります。これをみると、シールドトリガーの枚数の期待値はシールドに埋まっているシールドトリガーの枚数のある程度の指標にはなりそうですね。(少なくとも、上で見たような分散のとても大きいような分布ではなさそうですね)

スクリーンショット 2022-03-07 1.11.06


期待値は何を表している?(大数の法則)

「期待値は確率変数の取る値のある程度の指標になる」「分散の小さい確率変数ではだいたい期待値周りの値が現れることが「期待」できる」などと言ってきましたが、こんな結論では満足できないぞって人が多いと思います。第一、せっかく数学を使っているのに、「ある程度」とか「期待できる」なんて主観的な表現で結論づけるなんてもったいなさすぎますよね。

安心してください、期待値は単なる「指標」なだけではなく、実際に「現れて」くれます。しかし、そのためには一回の試行ではなく試行を繰り返し行うことが必要になります。

この時、期待値の解釈を与えてくれる定理として大数の弱法則/大数の強法則というものがあります。

少々難しく感じるかもしれませんが、一旦主張を見てみましょう。(これもここでは証明は省略します)

大数の弱法則

{$${X_i}$$}$${(i=1,2,3,...)}$$を独立で同一な確率分布に従う確率変数列とする

$${E[X_i]=\mu}$$が有限の値であるとき任意の$${\epsilon>0}$$に対して

$${lim_{n\to\infty} Pr[|\bar{X}_n -\mu|\leq\epsilon]=1}$$

が成立する。(これを$${\bar{X}_n}$$ が$${\mu}$$に確率収束すると言う)

ただし$${Pr[A]}$$は事象$${A}$$が起こる確率を表す。

大数の強法則

{$${X_i}$$}$${(i=1,2,3,...)}$$を独立で同一な確率分布に従う確率変数列とする

$${E[X_i]=\mu}$$が有限の値であるとき

$${Pr[lim_{n\to\infty}\bar{X}_n =\mu]=1}$$ が成立する。(これを$${\bar{X}_n}$$ が$${\mu}$$に概収束すると言う)

スクリーンショット 2022-03-07 6.18.20

(一見見慣れない記号が並んでいてギョッとするかもしれませんが高校で極限の考え方まで習っている方であれば、落ち着いて主張を追っていけばその気持ちは理解できると思います。)

この大数の弱法則と大数の強法則を合わせて大数の法則と呼び、名前の通り大数の強法則は大数の弱法則よりも強い主張をしていますが今回はその違いはあまり気にしなくて大丈夫です。また今回は独立同一分布の場合に絞っていますがそうでない時にも拡張できます。

(怒られが発生しそうですが)超超大雑把にいうと、一回の試行に対して確率変数Xが定義されているとき、その試行を何回も繰り返していくと、その度に得られていく確率変数$${X}$$の値たちの平均値は$${X}$$の期待値$${E[X]}$$に限りなく近づいていくということです。

確率収束や概収束と言った概念が出てきましたが、これらは結局高校の数Ⅲで習うのと同じように、数列{$${\bar{X_{n}}}$$}がE[X]に収束するということを言いたいのだけど、この数列{$${\bar{X_{n}}}$$}は高校で扱う数列のように決まったものではなく確率的に値が変わる数列だから、その収束についても確率的に議論する必要があるということです。他にも確率変数の収束にはr次平均収束、法則収束と言ったものがあります。

ではシールドトリガーの枚数を例にして考えてみましょう

今回も簡単のため、40枚中8枚のシールドトリガーが入ったデッキを用いて複数回試合を行うことを考えます。$${i}$$試合目のシールドの中のシールドトリガーの枚数を$${X_i}$$とします。また、計n試合行った時のシールドトリガーの枚数の平均値を$${\bar{X_n}}$$とします。つまり、

$${\bar{X_n}=\frac{X_1+X_2+...+X_n}{n}}$$

この時大数の(強)法則により、$${n}$$を限りなく大きくしていくと確率1で$${\bar{X_n}}$$が$${E[X_i](=1)}$$に限りなく近づいていくということがいえます。

では実際にこれを試してみましょう。40枚中8枚のシールドトリガーが入っている時、シールドの中のトリガーの枚数$${X}$$の確率分布$${P_X}$$は

$${P_X(0)=\frac{25172}{82251},P_X(1)=\frac{35960}{82251},P_X(2)=\frac{17360}{82251},P_X(3)=\frac{3472}{82251},P_X(4)=\frac{280}{82251},P_X(5)=\frac{7}{82251}}$$

であったので、コンピュータ上で

$${X_1,X_2,...X_{2000}}$$をそれぞれ

確率$${\frac{25172}{82251}}$$で0

確率$${\frac{35960}{82251}}$$で1

確率$${\frac{17360}{82251}}$$で2

確率$${\frac{3472}{82251}}$$で3

確率$${\frac{280}{82251}}$$で4

確率$${\frac{7}{82251}}$$で5を

とるようにし、得られた$${X_1,X_2,...X_{2000}}$$に対して

$${\bar{X}_n=\frac{X_1+X_2+....+X_n}{n} (n=1,2,3,...2000)}$$

を計算するコードを書き、上記のシールドトリガーの例と同じ状況を再現しました。これによって得られた$${\bar{X}_n}$$を$${n}$$に対してプロットすると以下のようになりました。

スクリーンショット 2022-03-07 2.10.03

これをみると、確かにシールドトリガーの枚数の平均値が1に収束していく様子が見て取れます。

実際のデュエプレの対戦においても、時間はかかりますが、毎試合のシールドトリガーの枚数(代わりに初手の五枚のなかのシールドトリガーの枚数を数えるのがいいと思います)の平均値も同様に期待値に収束していくはずです。

たまにtwitter上などで「ゲームの確率の設定がおかしい!」といった内容の主張を目にしますが、上記のような実験をすればその結果から逆にその「ゲームの確率の設定」を検証できますね。もちろんシールドトリガーの話だけでなく、適切に確率変数を定義し試行回数を重ねれば、いわゆる「初手事故」に関することや、ガチャの排出率など(富豪にしかできない実験ですが、、、)いろんな検証ができますね。

これと同じ話で、記事の最初の方に例にあげた、実際のサイコロの確率分布を検証するという実験を高校や大学の授業でやったことがある方も多いのではないでしょうか。

例えばサイコロを何回も振った時、確率変数$${X_i}$$を$${i}$$回目に1の目が出たなら1そうでないなら0と定めます。サイコロの1の目が出る確率を$${p}$$とすると$${E[X_i]=p}$$なので、$${\bar{X}_n}$$の値はどんどん$${p}$$に収束(概収束)するはずです。理想的なサイコロであれば$${\frac{1}{6}}$$に収束していくはずですが実際は、、、?みたいな実験です。


長くなってしまいましたが、結論としてはシールドトリガーの期待値を見て我々が「期待」できることは、

「十分多数の試合を行なえば、シールドトリガーの枚数の平均値が1試合でのシールドトリガーの枚数の期待値に限りなく近づいていく」

ということです。

ここで少し注意してもらいたいのは、あくまで各試行(試合)におけるシールドトリガーの枚数の確率分布ははそれ以外の試行から独立しており、前の試合でたくさんトリガーしたから次の試合ではトリガーが少ない可能性が高いなんてことは全くありません。


おわりに

ここまで読んでいただいてありがとうございます。この記事を読んで、「もっと詳しく知りたい」とか「もっと一般の場合について知りたい」と思った方には測度論的確率論や統計学を学んでみる事をお勧めします!



この記事が気に入ったらサポートをしてみませんか?