ポーカーの分散は大きすぎる。ぴえん。

ポーカーの分散とは

ポーカーは分散が大きい。ポーカーは下振れがある。
などとよく聞きます。
ポーカーの分散とは何でしょうか。
ポーカーにおける分散とは、ある戦略はあるウィンレートをもつが、実際の収益はばらつきがあり、このばらつきを分散と呼びます。

数学的考察

数学的に述べて見ましょう。
ある戦略をハンド数xまで回した時の収益を y=f(x)「単位:BB」 とします。
f(x)は基本的にランダムなグラフを描きますが、y=nxとなる漸近線が存在します。
つまり、1ハンド当たりの収益がnとなるように収束します。

これは直感的には分かりやすいと思います。
ハンド数を多くまわせば、収益が増え。収益が増えれば増えるほど、総収益に対してのデータのばらつきが少なくなるというイメージです。
これを数式で表現したいと思います。

正規分布における分散の特性

まず、1ハンドでの収益f(1)は正規分布になっています。(要証明)
この正規分布はある分散sを持ち、平均はμ=nになります。

ここで正規分布の再生性という性質を使います。
正規分布P1、P2の和は正規分布となり、その平均は(μ1+μ2)、分散は(S1+S2)となります。

同じ戦略を常に繰り返すため、f(2)=f(1)+f(1)となります。
この時、f(1)は確率質量関数(正規分布)となっており一意の値を取らないことに注意してください。
同様に、f(x)はf(1)をx回 足したものとして考え、先程の再生性の性質を使用すると
f(x)は正規分布となり平均がnx、分散がsxとなります。

f(x)はハンド数当たりではなく、今までの総利益に対しての関数となっているため分散が発散します。
これをハンドあたりで平均化する、つまり、f(x)/xを定義すると
平均がnで分散がs/xとなり、分散が収束します。
標準偏差が√(s/x)となって標準偏差の収束は1/√xになります。

ここまでで、母分散、母平均についての必要な考察ができたと思います。

実際に集計されたデータ

ここからは、実際に集計した標本分散を用いて、考えていきたいと思います。

まず標本分散は、要素数が十分に多い場合、母分散に近づいていきます。
この収束は早く、よく使われるStd Dev BB /100handは100の要素数からなる分散なっており、十分母分散に近いとされます。
(母分散に近づくのは早いが、母平均に近づくのは早いわけではない)

PT4で取得できる標準偏差 Std Dev BB /100hands は、先ほどのfを使えば、f(100)の値になります。(PT4を持っていないので確証はないですが・・・)
PT4を利用しているユーザーが言う、
「ポーカーの標準偏差は大体80~100になる」といわれているのは
f(100)の標準偏差について述べています。

PT4では、0~100、100~200、200~300と100ハンドごとに区切り、それぞれの区間で平均と分散と標準偏差を計算しています。(PT4持ってないのでわかりませんが)
実際に表示されるStd Dev BB /100hand はこの値の平均になっていると思います。

ポーカーの分散は大きい。

仮にf(100)の標準偏差(SD)が90とした場合、再生性により、f(1)のSDは9になります。
この9という値が示す意味は、1ハンドあたりの収益をnとして
1ハンドで9+nBB以上稼ぐ確率がおおよそ15%あり、逆に9-nBB以上失う確率が15%以上あるということです。
nはたいてい0.1とか、0.05とかの数字になります。nに対して9という数字が大きすぎます。これがいわゆる分散が大きいと言われているところです。

大体何ハンド程度まわせば、母平均が見えてくるのか
例えば、「95%(2σ)で、標本平均のBB/100が、母平均の±1BB以内に収まっている」ことがわかるハンド数は
2σ=1なので、σ=1/2となります。
180**2=32400 となり 100ハンド当たりなので 324万ハンドとなります。
±3以内なら、36万ハンドになります。
ぴえん🥺

ただしこのStd Dev BB /100handは戦略によって変わります。でも高々70程度にしかなりません。

ポーカーは分散がでかい。マジです。えぐすぎます。ぴえんです。


検定について全く知識がないので今度しらべて追記します。


間違い等ありましたらコメントください。

その他のこと

前半で述べた、f(1)が正規分布になっている証明について
まだはっきりとは証明できていないのですが、二項分布の集合になっているということを証明し、十分施行された二項分布が正規分布と近似できることが証明できれば、多分f(1)に関して証明できると思います。
証明できたら追記しますが、別に証明する必要もないかなあと

PT4のSDについて、
これ例えば集計が670ハンドだった場合、前半600ハンドの計算方法はわかるんですけど、70ハンドの部分に関してどうやって計算してるんだろうなあという疑問はあります。本文と同様に正規分布の再生性を使って、f(100)としたときの分散を計算しているんだと思いますが。


感想

今回は、ポーカーについて述べましたが、途中出ててきた正規分布の再生性と平均化した時に収束する性質は趣味でやっている天体写真に用いられる加算平均というアルゴリズムと全く同じことをしていました。加算平均がどのようなプロセスで収束が行われるのかがはっきりと認識ができて、ポーカー以外の知見が増えました。

この記事が気に入ったらサポートをしてみませんか?