見出し画像

【翻訳】エクスプロイトの力学【CASH、MTT、セオリー】GTOWブログ.43

GTOソリューションは、対戦相手がどのようなプレイをしようとも、それなりにうまく機能し、エクスプロイト不可能であるように設計されている。また、この事は、あるハンドで最善の選択肢がある場合、対戦相手がそのプレイをすると仮定することで達成される。したがって、GTOのアプローチは、対戦相手が利用できる良いオプションの量と収益性を最小限に抑える方法でプレーすることである。

言い換えれば、GTOの解決策は、対戦相手が犯すミスについての仮定を取り入れたり、それに頼ったりすることは無い。そのため、対戦相手がどんなに予測不可能な戦略を仕掛けてきても、それに堅実に対抗することができる。しかし、相手が犯したミスから利益を得る能力も制限される。はっきり言って、GTO戦略は多くの一般的なミスから利益を得ることができる;ただ、ミスを最大限に利用するように設計された戦略ほどは利益を得られない。

対戦相手が犯すであろう具体的なミスを予測できる場合は、そのミスを利用するために、エクスプロイト不可能なプレイから自ら乖離すべきである。これはGTOに違反しているわけではない。これは、もしあなたが利用しようと計画しているミスをソルバーに「教える」のであれば、ソルバーがすることと同じことである(ノードロックによってできる)。詳しくは以下の記事を読むこと


混合戦略と敏感さ

GTO戦略のある部分は、他の部分よりも対戦相手の反応に敏感である。例えば、BTNでAAをレイズすることは、100bbのキャッシュゲームでは、ブラインドが誰であろうと確実にベストプレイとなる。同じ場所で72oをフォールドするのも、ブラインドのプレイヤーがよほど大きなミスをしない限り、ベストなプレイとなる。しかし、A3oやT4sのような手は、あなたのレイズに対するブラインドの反応次第でどちらに転ぶかわからない。
なぜそう言えるのか?BTNのオープンレンジを示した下のチャートを見て欲しい。各ボックスの右下の数字は、相手が完璧に対応した場合のそのハンドのEVである。

もちろん、AAの場合、その判断は近しくは無いと言えるが、それ以下の多くの手ではEVが近似しているという事実がある。AToとJ8sは均衡状態においてオープンする事が利益的であり、ブラインドがどう反応しても利益が出る。仮にブラインドがソルバーより多くコールや3ベットをしたとしても、これらのオープンは利益を生む。EVを得ることさえある!逆に、72oは利益を生むオープンとは程遠く、ブラインドがコールや3ベットを最適より多少少なくしても、利益を生む可能性は低い。

しかし、多くのハンドでは、レイズとフォールドは均衡時のEVが似ている、 つまり、対戦相手が完璧に対応出来なければ、どちらかのオプションが優位になる可能性がある。どのような混合戦略でも、混合されたすべてのオプションのEVは同じでなければならない。もしそうでなければ、ソルバーは一方の行動を他方の行動より好むことになる。つまり、対戦相手とのわずかな乖離が、一方の選択肢をより有益にする可能性があるということだ。

しかし、純粋戦略でさえもかなり敏感である。完璧にプレイするブラインドにT4sをオープンした場合のEVは-0.01bbに過ぎない。ブラインドが頻繁にフォールドしたり、スリーベットが少なかったりして、ソルバーが予想する以上のエクイティが実現できれば、これは利益を生むオープンになる可能性がある。逆に、ソルバーがピュアオープンとして示したT6sでさえも、3ベットを頻繁にするブラインドに対しては利益が出ず、ピュアフォールドになる可能性がある。ハンドが閾値に近ければ近いほど、後ろのプレイヤーの反応に敏感になる。

4段階のエクスプロイトプロセス

拙著『Play Optimal Poker』では、エクスプロイト思考のための4つのステップを推奨している:

  1. 均衡を思い描く

  2. どのように乖離しているか予測する

  3. どうエクスプロイトをするかを見極める

  4. 乖離の程度を見極める


1)均衡を思い描く

"もし対戦相手と私がGTOスーパーコンピューターに置き換えられたら、このハンドはどのように展開するだろうか?"と自問してみよう。あなたはGTOスーパーコンピューターではないので、これに正確に答えることはできないだろうが、以下のような要素を考慮すべきだ:

  • どちらのプレイヤーがよりベットするべきか?

  • 各プレイヤーはどのようなレンジでベットするべきか?

  • 各プレイヤーがバリューベットするのに最適なハンドはどれか?

  • 私がベットした場合、相手のレイズレンジはどのようになるべきか?

  • 相手が全スタックを賭けるべき最も弱いハンドは何か?

相手の均衡戦略がどのようなものであるべきかの感覚を持てば、相手がそこからどのように乖離しそうかを想像しやすくなる。そして、その乖離を利用する方法を考えることができる。

ゲーム理論を学びたての人にとって、これはおそらく全過程の中で最も難しいステップだろう。たとえ大まかな輪郭(「私はほとんどチェックすべきで、相手はほとんどベットすべきだ」)程度しか正しく理解できなかったとしても、均衡についてまったく考えないよりは大きな進歩だと言える。練習や経験、勉強を重ねることで、均衡を思い描くことはどんどん上達する。

2)どのように乖離しているかを予測する

"相手はどのように均衡から乖離しているのか?"と自問すること。これを明確に、できるだけ具体的に。"彼らはルーズすぎる "や "彼らは魚だ "よりも、"彼らはリバーで純粋なブラフキャッチャーで頻繁にコールしすぎる "の方が役に立つ。勘しかなくても構わない。確実に勝てるハンドを持つことが稀であるように、確実に読めることも稀である。ポーカーは基本的に、不確実な状況下で決断を下すゲームなのだ。プロセスの後半では、あなたの読みに対する自信についてを説明する。

3)どうエクスプロイトをするかを見極める

均衡戦略から乖離しそうなスポットを見つけたら、"このミスを搾取するためにはどうしたらいいか?"と自問する。ここでも、できる限り正確かつ具体的に答えたい。また、特定のミスを搾取する方法は1つだけではないことが多いので、クリエイティブであるべきだ。

4)乖離の程度を見極める

"均衡からどこまで乖離すべきか "を自問してみよう。

相手がリバーで十分なブラフをしないと感じ、あなたはフォールドの回数を増やして相手をエクスプロイトするつもりだとする。次のステップは、どれくらいの頻度でフォールドするかを決めることだ。これは単に、判定が僅差になるときにフォールドすることを意味するのか?セカンドナッツをフォールドするのと同じくらい極端にするのか?それともその中間か?という意味である。

ブラフを見つけるのが難しいリバーもあれば、そうでないリバーもある。しかし、相手のミスの大きさと、自分の読みに対する自信の度合いという2つの要素を事前に考慮することができる。均衡戦略から乖離しているように見える相手をエクスプロイトするためには、あなた自身も均衡から乖離しなければならないことを覚えておいてほしい。その結果、自分の読みが間違っていた場合に自分がエクスプロイトされる可能性が高まる。

実際の例

最終的なボードが22223である場合の単純化したリバーのシナリオを考えてみよう。IPのプレイヤーは44-AAというレンジを持っており、OOPはそのレンジの中間の手である77-JJしか持っていない。ポットには100ドルある。IPは$100をベットするかチェックする。ベットした場合、OOPはコールするかフォールドする(仮にベットやレイズが許されたとしても、OOPは決してそうしないだろう)。
IPの均衡戦略またはGTO戦略は、JJ以上のものをベットし、OOPのブラフキャッチがインディファレントになるような頻度で、44、55、66(どれも等しく無価値なのでどれでもよい)の組み合わせでブラフをかけることである。

バリューベットはすべて純粋戦略であり、ベットをする事がチェックより確実に利益的であることを意味する。最も薄いバリューベットであるJJでさえ、ベットすることで$133.92の価値があり、チェックすることで$98を稼ぐのとは大きな違いがある(OOPのJJとチョップすることもあるため、チェックしてもポット全額を獲得することはない)。
つまり、ブラフは全て混合戦略となり、ベットはチェックと同じEV、この場合は$0でなければならない。

OOPがIPのブラフをインディファレントにするためには、コールの頻度が50%に達しなければならない(ここではJJによるブロック効果があるため、ごくわずかに50%より少ない)。JJはIPのバリュー・ベットの一部をブロックするのでコールが支配戦略であり、残りは純粋なブラフキャッチャーであり、コールするかフォールドするかでインディファレントである。
両プレイヤーのエクイティは50%だが、このゲームでのIPのEVは$67.70で、ポットの半分の$50をはるかに超えている。OOPが可能な限り良いプレイをしているにもかかわらず、これは事実である。ポラライズドレンジでベットをする機会は、相手がどう反応しようとも、本質的に利益的である。

OOPの戦略をノードロックし、50%ではなく52%の頻度でコールするようにしたら、どうなるとあなたは予想するだろうか?この少しだけルースなコール戦略をエクスプロイトするために、IPはどのように戦略を変えるだろうか?全く変えないと予想するか、ブラフを少し減らすと予想するか、それとも劇的に減らすと予想するか。以下のソリューションをあなた自身で確かめてほしい。

OOPのコール頻度がこのようにごくわずかに増えたことで、IPはブラフを完全にやめた!これは、これらの混合戦略がすべてOOPの反応に極めて敏感だったからである。純粋戦略はどれも変わっていないことに注目してほしい。TTは依然としてチェックするハンドとして最も利益を上げているが、これは均衡時に特に接近した決定ではなかったからである。

OOPを100%コールする巨大なコーリングステーションに変えると、TTはIPにとってバリューベットになるが、99は依然としてチェックが最高のパフォーマンスを発揮する。

相手のミスをエクスプロイトする場合でも、ベースライン戦略やGTO戦略を考えることから始めるのが有効だ。その戦略のどの部分が相手の反応に最も繊細であるかを理解すれば、その反応がどのような乖離をしているか、どのようにエクスプロイトするかについて、より情報に基づいた有益な決断を下すことができる。

アーリーストリートにおける適応

相手が将来のノードでミスをすることが予想される場合、そのミスから利益を得るハンドでそのノードに到達する価値が高まり、後でそのミスから利益を得ることを期待して、アーリーストリートで異なるプレイをする動機付けになるかもしれない。

ある相手がターンで頻繁にコールしすぎるという読みがあったとしよう。ターンでのブラフを減らすことは明らかな攻略法のように思えるが、相手がリバーで頻繁にフォールドしていた予測出来るとしたらどうだろう?その場合、後でスティール出来ると予想されるポットが大きくなることを見越して、ターンでブラフを多用するインセンティブが働くかもしれない。
同様に、相手がリバーでブラフを多用した場合、あなたはそのことをターン(およびそれ以前のストリート)の判断に反映させるべきである。ほとんどの場合、これはリバーでのブラフキャッチからの余分なバリューが得られる事を期待して、より多くのターンのベットをコールすることを意味する。しかし、あなたのハンドがリバーをコールするのに特に適していない場合、たとえGTO的にはターンでのコールで利益が出るようなハンドであっても、すぐにフォールドした方がよいだろう。このようなハンドにおけるGTO戦略は、リバーであなたがこの対戦相手に期待する以上にチェックやショーダウンをすることを想定している。
このようなエクスプロイトは、プリフロップの判断にまで遡ることができる。フロップ後の相手のミスが予想されればされるほど、そのミスから利益を得るために相手とポットに入るインセンティブが高まる。しかし、ここで大きな注意点がある。

マルチウェイポット

フロップの前、あるいは複数のプレーヤーがライブハンドを持っている場合、特定の相手をエクスプロイトするのには限界がある。
フロップの前に、BBのプレイヤーがスモールレイズに対してブラインドをフォールドしすぎるニットであることが分かっていたとする。もしあなたが9ハンドのテーブルでUTGであれば、そうでない場合よりもごくわずかにオープン幅を広げることができるかもしれないが、それでもコールやスリーベットをしてくるかもしれない他の7人のプレイヤーがいるため、あまり無茶をすることはできない。

もしBTNであなたのアクションまでフォールドで回ってきたら、BBがあなたのオープンレンジの主な懸念対象となるため、あなたはより多くのハンドをオープンする余裕があるだろう。それでも、SBからのスリーベットの脅威、特にあなたがタイトなBBに対してオープンレンジを広げることを予期出来るような精通したプレイヤーがSBにいるような場合には、あなたは多少制約を受けることになる。

同様の力学はフロップの後にも起こりうる。UTGがオープンし、あなたがBTNでコールし、BBがコールしたとする。UTGは素直すぎるプレイヤーで、フロップ後は確実に強い手をベットし、弱い手をチェックするが、BBはタフで精通した対戦相手であり、UTGのミスやそれに対するあなたの適応に気づいていると予想される。UTGがあなたにチェックした場合、あなたはUTGからの余分なフォールドエクイティを得るために、GTO戦略よりもいくらか多くベットしたいだろうが、BBがあなたにコールしたりチェックレイズしたりすることもいくらか多くなると予想すべきである。プリフロップの例と同じように、あなたとBBは互いにエクスプロイトされることなくUTGのミスを利用することができる。UTGが賢くなり、強いハンドをチェックしたり、ブラフでチェックレイズしたりすれば、あなた達二人をエクスプロイトすることができる。

後者のケースは、GTOとエクスプロイトの力学の融合と考えるのが最も適切で、あなたとSBは互いにバランスを保ちながらBBのミスに適応することで、より多くのポットの分け前を要求することになる。この場合、あなたはそうでない場合よりもやや広めにオープンし、SBはやや広めにコールや3ベットをし、あなたはそうでない場合よりもやや弱いハンドでその3ベットをコールまたは4ベットすることになる。BBのミスにより、あなたとSBは互いに搾取されることなく、より多くのハンドをプレイできるようになり、新たな均衡が生まれる。あなたの均衡戦略の乖離から利益を得ることができるプレイヤーはBBであろう。もしBBが何が起こっているかに気づき、自分のコール、スリーベット、フォーベットの頻度を増やせばあなたたち2人をエクスプロイトする事になる。

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

記事は以上になります。最後まで読んでいただきありがとうございました。
この記事を読んで良いと感じて頂けましたら、noteのスキ、やSNSでの拡散、Twitterのフォロー、サポート等をして頂けますと、本当に執筆の励みになります!

この記事が気に入ったらサポートをしてみませんか?