見出し画像

GTO+でAKQゲームをしてみた①


ポーカーでGTOを勉強するときに最初に出てくるのがAKQゲームです。これをGTO+使って計算してみました。解析結果を見てなぜそうなるのかを考えることでGTO理論の基礎を理解できればいいなと思います。

この記事はGTO+の解析結果ありきでどうしてそういう数字になるのかを考えるという「結果→理論」の順番なので、一般的にGTOを勉強する際の「理論→結果」とは全く逆の順番を辿ります。混乱するかもしれませんが、その方が理解しやすい人もいるはずです笑

AKQゲームを理論から勉強したい人はこちらの記事がオススメです。


最初に (A,Q) vs (K) を考えます。次に (A,K,Q) vs (A,K,Q) の相互レンジを考えます。最後に (A,K,Q) vs (K,Q,J) でエクイティに差がある時を考えます。

理解が間違っている箇所もあるかもしれませんが、そのときはコメントでご指摘をお願いします。

1. ポラライズレンジとリニアレンジ

1.1. 設定条件

まずはAKQゲームでの (A,Q) vs (K) を考えます。AKQゲームはAとKとQの三枚からなるデッキをプレイしますが、ここではAAかKKかQQしか配られない世界だと考えてください。(凄いイカサマディーラーですね笑)

スクリーンショット (291)

GTO+でのツリーは上図の通りです。OOPはKKのみ、IPはAAかQQが配られます。OOPはKKというマージナルなハンドで構成されたリニアレンジだと言えます。一方IPはナッツのAAとナットロー(最弱ハンド)のQQからなるポラライズレンジで構成されています。

初めのスタックは$3、お互いにアンティを$1ずつ払ってポットサイズは$2、残りのスタックはお互いに$2で、チェックかオールインしか選択肢はありません。ボードは22233でハンドの強さだけで勝敗が決まる状況です。レーキはありません。


1.2. OOPのアクション

まずはOOP(KK)のアクションです。

スクリーンショット (295)

OOP(KK)の初めのアクションは100%チェックです(赤〇)。もしベットしてしまうと、相手がAAのときだけコールされてQQのときに降りられるのでエクスプロイトされます。

ここで面白いのが、エクイティは50%なのに期待値が$0.5しかない点です(オレンジ〇)。エクイティが50%である理由は、相手がAAを持っている可能性50%、KKを持っている可能性50%なので「これ以上アクションがなければ」50%の可能性で勝てるからです。

エクイティの$0.5がどこから来るのかは後述しますが、ポットが$2なのでエクイティで分配すると$1のはずです。つまり、ベッティングがあることによって$0.5分を奪われているのです。


1.3. IPのアクション

OOP(KK)がチェックしたあとのIP(AA,QQ)のアクションです。

スクリーンショット (298)

IPのアクションはAAなら100%ベット、QQの50%でブラフベットします(黄色〇)。このときのエクイティは50%であるのに対し、期待値は$1.5もあります(オレンジ〇)。ポットは$2なのでエクイティ分配の$1に加えて「AAで100%バリューベット、QQの50%でブラフベット、QQの50%でフォールド」というアクションの組み合わせによって$0.5分の期待値を稼いだことになります。

トータルの期待値は、ベットの期待値にベット頻度をかけたものと、チェックの期待値にチェックの頻度をかけたものを足すことで求まります。

EV = EV bet × bet% + EV check × check%   (式1.1.)

この式に出てくる数字をGTO+でひとつずつ確認します。

まず、ベットの期待値です。

スクリーンショット (299)

タブをベットに切り替えました。IP(A,Q)のベットの期待値は$2です(オレンジ〇)。なぜ$2もあるのでしょうか?

GTOでベットする目的は、相手のアクションを無作為にすることです。すなわち、相手がこちらのベットにコールしてもフォールドしても期待値は同じという状況に持ち込みます。もし違うなら相手は期待値が高い方のアクションを取るわけで、それはこちらがエクスプロイトされているということです。

OOP(K)のフォールドの期待値は0です。体感では初めに支払ったアンティ分の-$1ですが、ポットは誰のお金でもないので、フォールドというアクションによる期待値は$0です。なのでOOP(K)のコールの期待値も$0になるようにIP(A,Q)はベットします。

ポーカーはゼロサムゲームなので、プレイヤー2人の期待値を足したらポットの$2。いまOOPの期待値を$0にするように打っているので、こちらの期待値は$2-$0=$2として求まります。

解釈次第ですが、ベット額$1自体は増えも減りもせず、ポットの$2は全てIPのものということです!もしアクションがなかったら、エクイティ分配の$2×50%=$1だけだったわけですから、バランスの取れたベットによってポット$2に含まれる相手のエクイティを奪っているのです!


次に、チェックの期待値です。QQでチェックしたとき相手は必ずKKなのでそのままショーダウンで負けて期待値は$0です。タブを切り替えるまでもありません笑


最後に、ベットの頻度とチェック頻度です。

スクリーンショット (290)

ベット頻度は75%、チェック頻度は25%です。AAとQQのコンボ数は同じなので、AAで100%バリューベット、QQの50%でブラフベットすると、ベットは全体の75%になりますよね。

AAを持っているとき必ず勝てるのでIPにチェックする動機はありません。ポット$2に加えて更なるバリューを取りに100%頻度で$2をベットします。ではなぜブラフベットはQQの50%頻度なのでしょうか?

IPがベットをしたとき、OOPが直面する状況はポット$2に対してベット$2なので、2to1のオッズがあります。すなわちブレイクイーブンポイントは33%です。OOPが勝つのはIPがQQでブラフベットをしていた時で、負けるのはAAのバリューベットだった時です。先述の通り、OOPのコールの期待値を0にするのがGTOなので、IPのブラフ率はそのままOOPのブラフキャッチの必要勝率と同じになります。

そしてポットベットするとき、ブラフ率を33%にしないといけないので、バリュー2に対してブラフ1を組み込みます。AAとQQのコンボ数は同じなので、QQの50%でブラフするのです。


これで(式1.1.)の数字が全て揃いました。

EV(IP) = $2 × 0.75 + $0 × 0.25 = $1.5   (式1.2.)

エクイティが同じなのにポラライズレンジの方が期待値が高い理由がお分かりいただけたでしょうか。


1.3. OOPのアクション②

IP(AA,QQ)からベットされたときのOOP(KK)のアクションです。

スクリーンショット (301)

50%でコール、50%でフォールドしています(赤〇)。これまで見てきた通りIPのバランスの取れたベットによって、OOPはコールしてもフォールドしても期待値は0です。つまりIPが戦略変更を行わないときOOPはコールとフォールドのバランスをどう変化させても期待値は0から変わらないのです。

ではなぜ50%でコールしなければならないのでしょうか?

それはIPのQQでのブラフベットとチェックを無差別にするためです。もしOOPがブラフに降りすぎているのなら、IPはブラフを増やすことでエクスプロイトできます。逆も同じで、OOPがブラフにコールしすぎるなら、IPはチェックを増やすことでエクスプロイトできます。

よってOOPがコールする頻度は、QQでブラフベットをする期待値をチェックと同じ0にすることを目的に決まります。つまりOOPのフォールド率はそのままIPのブラフの必要勝率と同じになります。

IPはブラフベットをするとき、$2のポットを獲得するために$2ベットします。つまりブラフベットの必要勝率は50%です。したがってOOPのコール率は100-50=50%となるのです。

ちなみに、ブラフベットの必要勝率をブラフエクイティ、ブラフキャッチに必要なコール率を最小ディフェンス頻度(MDF : minimum defense frequency)といい、両者を足すと1になります。


1.4. OOPの期待値

ここまでで全てのアクションについて、その数値とそうなる理由を理解できたわけですが、1.2.節でOOPの期待値$0.5はどこからくるのかという問いを後回しにしていました。IPの期待値が$1.5なので、$2-$1.5=$0.5と考えることもできますが、改めて全体のアクションを確認してみたいと思います。

スクリーンショット (302)

ポットが分配されるのはA, B, Cのときです。それぞれの発生確率とOOP、IPの期待値を一覧にします。

スクリーンショット (304)

Aでは、IPがチェックするのはQQだけなのでポットはOOPのものです。Bでは、IPのベットにはバリューとブラフがバランスされていてOOPのコールの期待値を0にしているのでポットはIPのものです。CではOOPが降りているので、ショーダウンなしにポットはIPのものです。

よって、IPの期待は$2×0.25=$0.5として求められます。

そうです。OOPが期待値を獲得できるのは、IPが降りてくれたときだけなのです!OOPはどう足掻いてもIPがバランスのいいベットをしてくる限り期待値を積み上げられません。IPにできることはだたミスをせず期待値を減らさないことです。

重ねて言いますが、エクイティは50%あるのに期待値が$0.5しかないということは、相手がポラライズすることでリニアレンジは不利な立場に立たされるということです。

でもそれはレンジだけでなく、IPという不利なポジションだからだと思ったでしょうか。では次はポジションを入れ替えて考えてみます。


1.5. ポジションを入れ替える

スクリーンショット (305)

全てのアクションを1枚にしました。小さくて少し見にくいかもしれませんが、ポジションを入れ替える前とアクションは全く同じであることが分かります。

よって期待値も全く同じです。それはベットする理由が同じだからです。OOP(AA,QQ)からベットする理由はIP(KK)のコールとフォールドを無作為にすること、IP(KK)のコールはOOP(AA,QQ)のQQでのブラフベットとチェックを無作為にすることです。

ポジションが変わっても同じということは、期待値の差はレンジとバランスされたベットによるものであるということが分かりました。




この記事が参加している募集

#最近の学び

182,350件

この記事が気に入ったらサポートをしてみませんか?