【翻訳】あなたのレンジは戦略に影響するのか？【セオリー】GTOWブログ.12

てっぺー/Liz3rd

2023年12月20日 21:26

上級者はよく、レンジが戦略に影響すると言う。レンジ対レンジでプレイしているのだから、ハンドだけを見るのではなく、全体的なレンジを考える必要があると言うのだ。

これは間違いなく良いアドバイスだが、ポーカーの本質について広く誤解を招くことになる。この記事の最後に、あなたはポーカーの戦略を新しい視点で見ることができるだろう。

Fixed（固定された）戦略vsDynamic(動的な) 戦略

まず、固定戦略と動的戦略の違いを理解する必要がある。

動的戦略は相手に合わせて調整する。したがって、動的戦略は時間とともに変化する。エクスプロイト戦略は動的である。

固定戦略は相手に合わせることはない。何があっても同じ戦略をとるだけだ。GTOは固定戦略であり、常に同じスポットで同じようにレンジをプレーする。

この区別が重要なのは、インディファレント、GTO、エクスプロイト戦略の本質を教えてくれるからである。

混合戦略のミスと純粋戦略のミス

ポーカーには基本的に2種類のミスがある

混合戦略のミス - 相手が調整した場合のみEVを失う。

頻度が正しくない。
適応力のある相手にはエクスプロイトされる。
固定戦略では罰せられない。

純粋戦略のミス-相手が調整しなくてもEVを失う。

相手の戦略に対して厳密にEVを失う行動をとること。
相手が戦略を変えなくてもEVを失う。

GTO戦略は、相手が純粋戦略をミスしたときに利益を得る。しかし、固定戦略であるGTOは、相手の混合戦略の頻度ミスなどから利益を得るようには適応しない。

ハンドがレイズやコールなどのアクションを織り交ぜた場合、理論的にはそれらのアクションは常に同じ期待値を持つはずである（GTO戦略に対して）。これがインディファレントの定義である。従って、相手の戦略が同じである限り、混合戦略の判断の頻度を変えてもリターンに影響はない。

コーリングステーションでの実験

２台のGTOボットがHUマッチを行う（レーキなし）。

ボット1 - 常に正確な固定GTO戦略をとる。
ボット2 - 同じくGTOをプレイするが、コールと他のアクションのどちらかを選択する際には常にコールする。

どちらのボットが有利か？

答えはどちらでもない、だ。
コーリングステーションボットは"無関心に"コールしており、「純粋なミス」はしていない。ボット1は固定戦略をプレイしており、それをエクスプロイトするために調整することはない。ボット2はバリューヘビーストラテジーにエクスプロイトされるが、ボット1が調整しないのでEVを失わない。これが均衡の本質だ。

コーリングステーションを、レイズとそれ以外のアクションで混合戦略を取るハンドを常にレイズするボットに置き換えることができる。これをマニアックボットと呼ぶことができる。マニアックボットは混合戦略のミスしかせず、純粋なミスは決してしないので、GTO戦略に対して損も得もしない。

ニットボットも同様で、GTOをプレイするボットだが、フォールドと他のアクションのどちらかを選ぶようなハンドは必ずフォールドする。GTOはニットをエクスプロイトするために適応しないので、ニットボットも固定GTO戦略に対して何も失わない。

ポラートイゲームにおける実験

千里眼ゲームを検証してみよう。

ポット＝10ドル
スタック = 10ドル
ボード = 33322
ヒーローは AAが50%、QQが50%である
ヴィランは100% KKを持つ
ヒーローがリバーでポットサイズのオールインを行う

まず、このゲームを解いて均衡戦略を見つけよう。次に、どちらのプレイヤーがどれだけ得をするか、または損をするかを見るために戦略を調整する。

ヒーローは常にAAをベットし、ヴィランのコールとフォールドをインディファレントにするようにQQでブラフをするべきである。ポットサイズのベットでポットオッズは2:1なので、ヴィランに33.3%のエクイティを与えるべきである。AAをすべてベットし、QQを半分ベットすると、バリュー：ブラフの比率はバリュー⅔ブラフ⅓となる。

ヴィランはこのオールインにインディファレントである。もし我々がバリューに偏りすぎていたら、彼らは常にフォールドするだろう。もしこちらがブラフヘビーであれば、必ずコールするだろう。しかし、彼らはコールするのに適したポットオッズを持っている。したがって、彼らはMDFに従ってコールして対応すべきである。

KKはこのポットサイズのベットに対して、ブラフヘビーやバリューヘビー戦略によってエクスプロイトされないように、ちょうど半分の確率でコールすべきである。これは、ブラフをベットとチェックの間でインディファレントにさせる効果がある。

AA - 常にオールイン
QQ - 50%オールイン、50%チェック
目標：ヴィランに33％のエクイティを与え、コールとフォールドをインディファレントにする。

KK - 50%コール
目標：ヒーローのブラフをベットとチェックをインディファレントにする。

ヒーロー： $7.5
ヴィラン： $2.5（ヒーローはレンジの25%をチェックバックし、常に負けるので、ヴィランは$2.5得する）

クイズ1

ヒーローが常に上記の均衡戦略を使うと仮定しよう。以下のシナリオにおける期待値はいくらか：

①ヴィランが常にフォールドする
②ヴィランが常にコールする。

クイズ2

ヴィランが常に上記の均衡戦略を使うと仮定しよう。これらのシナリオにおける期待値はいくらか：

①ヒーローが常にブラフを行う（AAとQQを100％オールインする）
②ヒーローは決してブラフをしない（AA 100%ベット、QQ 100%チェック）

各シナリオの期待値を計算してみよう。

4つのシナリオともEVは変わらない！IPのEVは7.5ドル、OOPのEVは2.5ドル。
各プレイヤーがエクスプロイト可能で大きなミスを犯しているにもかかわらず、どちらも固定された戦略を使っているため、相手をエクスプロイトしていない。

あなたのレンジは戦略に影響するのか？

これは、多くのハイレベルなプレイヤーでさえ理解していない点である：

相手がdynamic(動的)戦略を採用している場合に限り、あなたのレンジはあなたの戦略に影響を与える

どうしてそうなるのか？それは非常に基本的な論理に帰結する。どんなハンド／アクションでも、期待値は相手の戦略の関数である。もし相手の戦略が自分のレンジに対して完全に変わらないのであれば、あなたは「レンジ対レンジ」ではなく、「あなたのハンド対相手の戦略」をプレイしていることになる。

誰かが「あなたのレンジがあなたの最適戦略に影響を与える」と言うとき、そこには隠れた前提がある。あなたのレンジが相手の戦略に影響を与え、あなたがレンジを変えれば相手も戦略を変えることができ、その結果あなたのハンドのEVが変わるということを言っている。

現実的には、あなたは常に自分のハンドを相手の戦略に対して最大化しようとしている。あなたが自分のレンジを考慮する理由は、あなたのレンジが相手の戦略に影響を与えるからだと認識しているからである。もし相手があなたをニットだと認識すれば、あなたのバリューベットでのペイオフを止めるだろう。もし相手があなたのことをブラフ過多だと感じたら、より多くコールするだろう。相手があなたのレンジを弱いと認識すれば、よりアグレッシブに攻めることができる。そう認識しているからである。

しかし、相手の戦略が不変（固定）であれば、あなたのレンジはあなたのハンドの最適戦略に影響を与えない。あなたは、バランスやあなたのレンジに対する相手の認識を気にすることなく、相手の固定戦略に対して自分のハンドのEVを最大化すればいいのある。

GTOボットで遊ぼう

HUをプレイしていてあなたのポジションはBB。ボットはQ95rのフロップで33%のベットをしてくる

このベットに対するGTO戦略は以下である

ボットは固定戦略をとっている。つまり

どのような頻度でレイズされるハンドでも純粋にレイズする
どのような頻度でコールされるハンドでもただコールする。
どのような頻度でフォールドされるハンドをフォールドする。

これらのアクションはインディファレントであり、ボットは私たちのアンバランスな混合戦略をエクスプロイトするために適応することはない。GTOのような固定戦略は混合戦略のミスを罰せず、純粋なミスのみを罰するからだ。

このトイゲームを見てあなたは怒るだろう

以下のボードのBTNとBBのSRPの均衡戦略見てみよう：

BTNはフロップで33%ベット、ターンで175%オーバーベット、リバーでBBにアクション。

ここでBBの最善の戦略は、ハンドの強さに関係なく、レンジチェックすることである。

ナッツでもピュアチェックすべきである。Q6s（クアッズ）での様々なアクションのEVを見てみよう。ご覧の通り、チェックが最も期待値の高いアクションである：

というのも、私たちのレンジはとても弱く、チェックされたときにヴィランがポットに大金を入れるはずだからだ。だから、クワッズはレンジチェックによってそのバリューを最大化する。

もしBBがこのリバーでクワッズだけを持ち、他のレンジが何もなかったらどうなるだろうか？
もしヴィラン（BTN）が同じ固定戦略を取り続けるとしたら、クワッズはどのようにプレイすべきだろうか？レンジがナッツである今、リードベットを始めるべきか？

A. BBはベットを始めるべきか？
B. ベットとチェックを混ぜるべきか？
C. それともレンジチェックを続けるべきか？

解答はC.レンジチェックを続けるべきである

BTNはリバーで全く同じ固定GTO戦略を使うことにノードロックされている。以前はチェックが最適であったので、こちらのレンジが純粋なナッツのみで構成されているにもかかわらず、ここでもチェックが最適である。

言い換えれば、相手の固定戦略に対して、私たちは単純にそれぞれのハンドを最大化することができる。ヴィランは戦略を適応させる能力がないため、こちらのレンジは戦略に影響を与えない。

これらの結論から得られるもの

最も重要な3つのポイント

混合戦略のミスと純粋なミスの違いを理解する。
それぞれのミスがどのように罰せられるかを学ぶ。
固定戦略と動的戦略を区別することがなぜ重要なのかを意識する。

混合戦略を取る（インディファレントな）ハンドは、対戦相手から搾取されるのを防ぐために混合しているだけである。もし対戦相手が戦略を調整できない、あるいは調整する気がないのであれば、混合戦略の判断のバランスにこだわるべきでは無い。その代わりに、相手を最大限にエクスプロイトすることに集中すべきだ。

正確な頻度は全体的な戦略よりも重要ではないことを理解することが重要だ。つまり、Q95rの例で言えば、J3sがフォールド/コール/レイズの何割かを混ぜていることは問題ではなく、実際に重要なのは（エクスプロイトされるかどうか、という意味で）ヒーローがフォールド/コール/レイズのレンジ全体の戦略をどのように構築するかということである。

どのような混合アクションも、相手がそれに対しアクションを起こさない状況ではプレイ可能である。どのような低頻度のプレイも、正当化できる。ハンドヒストリー分析で100％の精度を得ても、純粋戦略のミスにより大きくエクスプロイトされる可能性がある。逆に、頻度上のミスプレイをしていても、固定GTOソリューションによって決して攻略されることはない。

この記事が気に入ったらサポートをしてみませんか？