AKQゲームでvsGTO戦略においてこちらが戦略を変えたときの動きについて
ポーカーをしているとこのように思ったことはありませんか。
「分散を愛せとかいうけど、今、この、目の前の負けが許せない!!」
さて、皆さんはポーカーをやっていて「分散」について考えたことがありますでしょうか。期待値ばかり追っていて分散については「ポーカーにはつきものだ」という認識程度であまり考えたこともないという方も多いのではないでしょうか。
本記事はポーカーの座学している人にはおなじみのAKQゲームを題材に分散について考えるきっかけになってくれればと思います。そして、少しでも期待値だけでなく分散に関する議論がポーカーにおいて増えてくれれば幸いです。
今回のAKQゲームの設定について
今回は議論を単純化するために以下のようなルールの設定にさせていただきます。次郎さんがかわいそうとか言わないでください。
太郎さんは常にIP、次郎さんは常にOOP
太郎さんには常にAもしくはQが1:1の頻度で配られる
次郎さんには常にKが配られる
はじめにAnteとしてお互い$1ずつ支払う
可能なアクションは「check」、「bet($1のみ)」、「call」、「fold」
べッティングラウンドは1ストリートのみ
AKQゲームについておさらい
本章ではAKQゲームの太郎さんと次郎さんGTO戦略と片方がGTO戦略から外れた場合の期待値の動きについて簡単におさらいしていきます。
ググれば大量に良記事が出てきますし、結論を知っているよという方も多いと思いますので本章は飛ばしていただいて問題ありません。
また、一応導出のために数式を用いますが、数式見たくない、結論のみ知りたいよというかたも結論まで飛ばしてください。
GTO戦略の導出
次郎さんにもしbetされたら太郎さんはAでcallしてQはfoldしましょう。
そのようにするだけでbetした分次郎さんが損します。なので、次郎さんは100%最初はcheckするしかありません。
次に太郎さんがAをcheckしたとしましょう。すると、そのままshow downをすることになり太郎さんはAをbetしてcallもらえたかもしれない分損します。(callもらえなくてもそのままcheckしてshow downした場合と同じ利益を得られる)
ここまででわかる自明な結論としては
次郎さんは最初checkする
太郎さんはAを配られれば絶対にbetする
というものが得られます。
あと考えないといけないのが
太郎さんはQを配られたときbetするべきか
次郎さんはbetされたときcallするべきか、foldするべきか
です。
これらについて考えるため以下のように設定します。
次郎さんのbetされたときのcall頻度は$${p(∈[0,1])}$$
太郎さんのQを配られたときのbet頻度は$${p(∈[0,1])}$$
このゲームにおける太郎さんが$2得する確率
太郎さんがAを配られ、次郎さんがcallする場合なので$${p/2}$$
このゲームにおける太郎さんが$1得する確率
以下の2パターンが考えられる
1. 太郎さんにAが配られ、次郎さんがfoldする
2. 太郎さんにQが配られbetし、次郎さんがfoldする
1の確率は$${(1-p)/2}$$
2の確率は$${q(1-p)/2}$$
このゲームにおける太郎さんが$1損する確率
太郎さんにQが配られcheckするパターンのみなので$${(1-q)/2}$$
このゲームにおける太郎さんが$2損する確率
太郎さんにQが配られbetし、次郎さんがcallする確率なので$${pq/2}$$
期待値の計算とGTO戦略について
ここまでをまとめて期待値の定義に当てはめてまとめると
$${(p-3pq+2q)/2}$$
となる。
太郎さんと次郎さんはお互い相手の戦略を無差別にするためには以下の頻度が結論となる。
$${p = 2/3}$$
$${q = 1/3}$$
また、当然お互いは相手の戦略を無差別にしたので片方が上記戦略を維持している限りもう片方が頻度を変えてもお互いの期待値に変動はない。
また、お互いがGTO戦略通りの戦略を採用しているとき太郎さんの期待値は$${1/3}$$となる。
おさらいの結論
GTO戦略は
太郎さんに関して
Aは絶対にbet
Qは$${1/3}$$の頻度でbet
次郎さんに関して
最初は絶対にcheck
betされたら$${2/3}$$の頻度でbet
この時の期待値は$${1/3}$$
また、太郎さんがGTO戦略を採用し続ける限り次郎さんはbetに対してcallする頻度を変えても期待値に変動はない。
さらに、次郎さんがGTO戦略を採用し続ける限り太郎さんはQをbetする頻度を変えても期待値に変動はない。
AKQゲームの分散
ここまではおさらいでここからが本題です。
といっても、タイトルだけで察しの良い方は結論までなんとなく想像できる方も多いと思います。
今回は簡単のために相手がGTO戦略に固執してくれてExploitを一切行わないものとします。
まず結論
結論を言葉で書くとめちゃくちゃ当たり前なのですが
太郎さんがGTO戦略に固定される場合、次郎さんは100%foldすると分散を最小化できる
次郎さんがGTO戦略に固定される場合、太郎さんはQを配られたとき100%checkすると分散を最小化できるというものになります。
ここからどのような知見が得られるかというと
「相手の戦略が固定されているとき、こちらの戦略を変更することで期待値を変動させることなく分散を抑えることができる(かもしれない)」
ということになります。
期待値は稼いでいるのに実収支が乖離していると悩まれている皆様、期待値を維持しながら分散を抑える戦略が本当に存在しないか検討してみてはいかがでしょうか。
分散の導出
上記に関して、言葉にすると感覚的にも明らかではありますが一応分散を計算してみましょう。
分散についてよく知られている以下の基本的な公式を使います。
$${Var(X) = E(X^2) - E(X)^2}$$
期待値の計算の時に用いた各確率を参照して$${E(X^2)}$$を求めると
$$
\begin{array}{}E(X^2) &=& 4 * \frac{p}{2} + \frac{1-p}{2} + \frac{q(1-p)}{2} + \frac{1-q}{2} + 4 * \frac{pq}{2} \\\ &=& (3p+2+3pq)/2\end{array}
$$
また、少なくとも一方はGTO戦略を頑なに採用している仮定なので
$$
\begin{array}{}E(X)^2 &=& (1/3)^2 \\\ &=& 1/9\end{array}
$$
ここにいろいろな$${p}$$もしくは$${q}$$を入れて値を確認すると
両方GTO戦略の場合の分散・・・$${20/9}$$
次郎さんがGTO戦略で太郎さんのブラフ頻度が0の場合の分散・・・$${17/9}$$
太郎さんがGTO戦略で次郎さんのキャッチ頻度が0の場合の分散・・・$${8/9}$$
太郎さんがGTO戦略で次郎さんのキャッチ頻度が1の場合の分散・・・$${61/18}$$
最後に
ここまで長々とありがとうございました。いろいろ書きましたが、この記事を通して主張したいことはポーカーの分散の大きさについて、ただただ感情のままに文句を言うのではなく、「本当に期待値を維持しながら分散を抑える術はなかったのか」と少しでも考えてほしいと思った次第です。
もちろん、今回の記事に取り上げた例では現実的でない仮定の下での議論であることは重々承知です。しかし、ポーカーの分散に関しては期待値に比べて驚くほど議論が少ないように感じています。この記事をきっかけに一人でも多くの方にちょっとだけでもいいので分散について思考を傾けていただき、分散について現実のポーカーに何か有益な結論を得ていただけたら幸いです。
何か記事内に誤りがありましたらご指摘いただけたらと思います。
改めて、ご精読いただきありがとうございました。
この記事が気に入ったらサポートをしてみませんか?