見出し画像

No.11 GTO Wizard Blogの解釈記事【Does your range affect your strategy?】

本記事はGTO Wizard Blogを私なりに解釈し、友人に説明するならどのように書くかな?と再まとめしたものとなります。
今回の記事は「Does your range affect your strategy?」になります。

承認欲求を満たすために是非「♡」をお待ちしております。
X(Twitter)のフォローもお待ちしております。


本記事は「君のレンジが戦略に影響を及ぼすのか?」について、記載をしていく。

上級者はよく「レンジが戦略に影響を及ぼすと言う。レンジ vs. レンジでプレイしているのだから、自分のハンドだけではなく、全体的なレンジを考える必要がある」と言う。これは間違いなく良いアドバイスなのだが、ポーカーの本質について誤解を招くことになるだろう。

本記事も理論的な側面となるが、諦めずにしっかりと本日も座学をしていこう。


■ 固定戦略と動的戦略について

こちらはNo.1の記事にて簡単に触れさせて貰ったが、改めて説明をしよう。

  • 動的戦略
    戦略を相手に合わせて、アジャストする。状況や相手のリークに対して、エクスプロイトするために戦略を変更し戦っていくことは動的戦略となる。

  • 固定戦略
    戦略を相手に合わせることはない。GTOは固定戦略であり、同じスポットで同じ戦略を取り続ける。

この戦略に区別が必要なのは、インデファレント、GTO、エクスプロイトの性質を我々に教えてくれるからである。


■ ミスについて

ポーカーには基本的に以下の2種類のミスがある。

① 混合戦略ミス
混合アクションの頻度をGTOからずらしている場面を考えてほしい(今回の場合、相手のリークを突くために意図的に頻度をGTOからずらしていたとしても、混合戦略のミスとして捉えておいてほしい)。

この混合戦略ミスを相手が察知し、正しいアジャストを行ってきた場合に我々はEVロスをしてしまう。

(筆:ただ、混合戦略ミスは相手が固定戦略であるGTOを取ってきている場合にはEVロスを生みません。あくまでも相手が正しいアジャストを取ってきた場合にのみ、EVロスとなります。なぜ固定戦略であるGTOを取ってくる場合において、EVロスを生まないか。が疑問になっている人もいると思いますので説明させていただきます。混合戦略はどちらの戦略を取ったとしても、同じEVとなります。そのため、レイズとコールの混合戦略があった場合にはどちらの戦略を取ったとしても同じEVになるのです。そして、GTOが示す混合戦略には頻度が示されています。例えば、レイズ:コール=60%:40%だった場合にはその比率を守ればエクスプロイトされません。そして、今回相手はGTOである固定戦略を取ってきています。こちらの戦略に対し、一切アジャストをしてきません。じゃあ別に6:4である頻度を10:0にしたところでEVは変わりません。だって混合戦略は同じEVですので。だから、こちらが混合戦略ミスをしてしまったとしても、GTOである固定戦略はアジャストをしてこない→こちらのミスは咎められない/EVロスはしない。ということですね。)

② 純粋戦略ミス
レイズアクションが正しいところを、コールしてしまう。等のミスのこと。こちらは混合戦略ミスとは異なり、相手がアジャストをしなくても、EVロスとなってしまう。

まとめると

GTO戦略(固定戦略)は、相手が純粋戦略ミスをした時に利益を得ることができる。しかし、GTO戦略は、相手の混合戦略ミスからは利益を得ることはできない。

(筆:GTO戦略はエクスプロイトされないように強固な城壁を構えながら、相手が無暗に特攻してくる=純粋戦略ミスを待って、EVを勝ち取ります。レクはミスをするので、それだけでもEVが取れてしまいます。)

レイズやコール等のアクションを混合した場合、理論的にはそれらのアクションは常に同じEVを持つはずである(実はこれがインディファレンスの定義でもある)。従って、相手の戦略が固定戦略ある限り、混合戦略の頻度を変えても、リターンに影響はない。

(筆:戦略の対を整理すると、固定戦略と動的戦略、純粋戦略と混合戦略になります。混ざらないように注意しましょう。固定戦略と動的戦略の中にある戦略が純粋戦略と混合戦略です。)


■ コーリングステーションに対する例

2種類のGTOボットがHUマッチを行うとしよう(レーキはないものと仮定する)。

ボット① - 常にGTO戦略(固定戦略)をとる。
ボット② - 同じくGTOをプレイするが、混合戦略にコールアクションがある場合には常にコールする(仮想コーリングステーション)。

どちらのボットが有利か、考えてみよう。







答えは「どちらでもない」となる。

ボット②は混合戦略ミスを犯しているが、「純粋戦略ミス」は犯していない。加えて、ボット①は固定戦略をプレイしていて、アジャストをしてくることはない。

もし、ボット②はコール過多な戦略となっているため、バリューヘビーな戦略にエクスプロイトされるが、ボット①がアジャストをしないのでEVを失わない。これが均衡の本質であるため、しっかりと理解をしよう。

ボット②を混合戦略にレイズアクションがある場合には常にレイズするボットに置き換えてみよう(これをマニアックボットと呼ぼう)。マニアックボットも「混合戦略ミス」しかせず、「純粋戦略ミス」は決してしない。そのため、GTO戦略に対して損も得もしないのである。
ニットボットも検討してみよう(混合戦略にフォールドがある場合、常にフォールド)。GTOはニットボットに対してアジャストしないため、ニットボットもGTO戦略に対して何も失わない。

結局のところ、混合戦略の部分を変更したからといって、相手が固定戦略を取ってくるのであれば何もEVは変わらないのである。


■ ポーラーなトイゲーム

トイゲームを見てみよう。

(筆:これは千里眼ゲームと呼ばれたり、AKQゲームと呼ばれたりします。ポーカーはこのように戦略を簡易化して、このような状況下だったらどうしたらいいか?等を確かめるためにトイゲームとして、戦略を解いていくことを良く行います。このAKQゲームは基礎中の基礎なため、じっくり考えながら読んでみてください。)

  • Pot = $10

  • Stack = $10

  • Board = 33322

  • 君(OOP)のレンジは「50% AA, 50% QQ」

  • 相手(IP)のレンジは「100% KK」

  • 君がリバーでポットサイズのAIを行う。

仮定として、君は相手のレンジを知っているし、相手は君のレンジを知っているものとする。

※Shoveはオールインの意味

まず、このゲームのGTO戦略を見つける。次に、どちらのプレイヤーがどれだけ得をするか/損をするかを確認するために戦略をアジャストしていく。

まずベッター側(君)のGTO戦略を見ていこう。

君は常にナッツであるAAをベットしなければならない。なぜならば、IPの相手は君のレンジがAAとQQであることを知っている。ということはKKでベットする誘因がない。チェックをしてしまった場合、ナッツでのバリューを取り損ねてしまうことになるため、君は必ずAAでベットをしないといけないのだ。

(筆:AAにはコールされますし、QQには降りられるだけで、利益的なベットにはならないですからね)

次にQQをどのように扱うかを考えなければならない。エクスプロイトされないような頻度構築が必要である。

ではポットオッズを計算してみよう。必ず、自分で計算をしてほしいが、ポットオッズは33%となる。以下の記事で「ポットオッズは相手レンジ(ベッター側)に含まれているべきブラフと一緒になる」と説明した。そのため、ブラフが33%ということになり、バリューは67%の比率でベットすることとなる(これは「バリュー2に対して、ブラフを1打つ。」ということ)。今回の場合、レンジの50%であるAAがバリューとして全てベットとなるため、QQはその半分である25%をブラフとしてベットすることになる(残りの25%はチェックとなる)。

(筆1:ポットオッズの計算については問題はないでしょうか。当初私はポット$10のために$10のAIをしているのだから、$10/($10+$10)でポットオッズは50%になるのでは?と考えていました。実際、同じような疑問を持った方はいるのではないでしょうか。結論、先程示した計算は今後出てくる「α」を計算していることになります。そのため、計算ミスをしていることになりますね。ポットオッズはコーラー側の概念です。計算は常にコーラー側の視点に立って計算をしてください。では実際に計算をしてみると、$10のポットに対し、$10のAIをされています。ポットオッズの計算はコール額/(コール後のポット額)であるため、$10/($10+$20) = 0.33(33%)になりますね。)

(筆2:なぜポットオッズを計算するのよ。と頭がこんがらがってきた方向けに少し補足説明します。「① AIをした時のGTO戦略=どれだけブラフをすべきか?を確認したい(だってバリューは100%打つと検討しましたので残りはブラフどうするか?を検討しないといけないですよね)」→「② 前の記事で説明したようにポットオッズを計算すればどれだけベッター側にブラフが含まれているべきか。がわかる。」→「③ だからポットオッズを計算しよう。」となるわけです。)

君のベットのGTO戦略をまとめると以下の通りになる。

「AAは常にベットし、ブラフ側のQQは50%の頻度でベットする。」
(筆:ブラフ側が混合戦略を取っていることに注目しましょう。)

相手は君のAIにインディファレント(筆:混合戦略を取れる状態、コールとフォールドの損益分岐点にいます。なぜならば、君はコール/フォールドがどちらでもOKなようにブラフを打つ戦略を取っているからです。)である。もし君が混合戦略のブラフを減らし、バリューに偏ったとしたら相手は常にフォールドすることで君をエクスプロイトできる。もし君がブラフ過多になれば、全てコールすることで君をエクスプロイトできる。

次にコーラー側のGTO戦略を確認しよう。

君のベットはGTO戦略に基づいて、ベットしている。そのため、コーラー側もGTO戦略に基づいて、コールをしておけば問題はない。

ここでMDFという理論を使ってコールの頻度を決定する。MDFについては今後、記事化するため、そちらで詳しく説明するが、「相手のブラフを利益化させないための必要なコール頻度」と思っておいてほしい。

MDFは以下の数式で求めることができる。
MDF = pot / (bet+pot) = 10/(10+10) = 0.5 (50%)

よって、KKはポットサイズのベットに対して、、50%の頻度でコールすべきであることがわかった。これは、君のブラフをベットとチェックの間でインディファレントにさせる効果がある。

(筆:コーラー側から見たら、MDFに従い、適切な頻度でコールをすることで、ベッター側のブラフをベットしても、チェックしても、同利益にすることができます。)

ではこれまでの戦略を以下にまとめる。

  • 戦略(ベッター 君)
    AA - 100% AI
    QQ - 50% AI、50% チェック
    目標:ベットする際、相手に(こちらのレンジに33%のブラフが含まれている影響から)33%のEQを与え、コールとフォールド間にてインデファレントにする。

  • 戦略(コーラー)
    KK - 50% コール
    目標:君のブラフをベットとチェック間にてインデファレントにする。

  • EV
    ベッター: $7.5
    コーラー: $2.5
    (君はレンジの25%をチェックバックし、常に負けるので、相手は$2.5得する。言うなれば相手は君のチェックバックからしか利益を生まないのである。)

(筆:インデファレントってなんやねん。って思っている方も多いかもしれません。正直、私も正確に把握をしているわけではないかもしれないので、ふーーん。とその程度に捉えてほしいのですが、インデファレントというのは相手のアクションを混合戦略へ落とし込みます。混合戦略はどちらのEVも同じであることを説明しました。ただ、適切な頻度を守らないとエクスプロイトされる余地がでてきます。結局、インデファレントは相手を難しい局面に立たせ、混合戦略ミスを誘引させる。その後、混合戦略ミスはエクスプロイト可能なため、エクスプロイトして、利益を得るプロセスだ。と勝手に理解しています。)

さて、トイゲームを実際に解いたため、より踏み込んだクイズをしよう。

クイズ①
君が常に解いたGTO戦略を使うと仮定した場合、以下のシナリオにおけるEVはいくらか?

  • 相手が常にフォールドする。

  • 相手は常にコールする。

クイズ②
青手が常に解いたGTO戦略を使うと仮定した場合、以下のシナリオにおけるEVはいくらか?

  • 君が常にブラフを使う(AAとQQを100%使う)。

  • 君は決してブラフをしない(AA 100%、QQ 0%)。








(答え)
4つのシナリオともEVは変わらない。IPのEVは7.5ドル、OOPのEVは2.5ドルとなる(筆:計算してみてください。)。各々のプレイヤーはエクスプロイト可能な大きなミスを犯しているにもかかわらず、どちらもGTO(固定)戦略を使っているため、アジャストをしていない=EVが変わらないからである。

(筆:混合戦略ミスは正しいアジャストをされないと咎められない。ということはこういうことなんです。)


■ 君のレンジは戦略に影響するのだろうか?

上記、質問はハイレベルなプレーヤーでさえ、理解をしていない。

相手が動的戦略を取る場合に限って、君のレンジは君の戦略に影響を及ぼす

どうして上記のことが言えるのだろうか?

基本的な論理をしっかり考えていこう。どんなハンドやアクションでも、EVは相手の戦略によりもたらされる。もし相手の戦略が変わらない場合、君は「レンジ vs. レンジ」ではなく、「自分のハンド vs. 相手の戦略」でプレイしていることになる。

(筆:かなり尖った言い方をしますが、相手が固定戦略を取ってくるのであれば、こちらは純粋戦略ミスをしなければ、何をしてもEVロスは引き起こしませんでしたよね。そして、フォーカスされるのは「純粋戦略ミスをしないこと」=「自身の持っているハンドを正しく扱うこと」になります。だから、「レンジ vs. レンジ」にて戦う必要はなく、「自分のハンド vs. 相手の戦略(固定戦略)」にて戦うことになる。と言っているのです。)

誰かが「君のレンジが君の最適な戦略に影響を与える」と言ったとしよう。「???」となるかもしれないが、このように言い換えてみよう。彼らは、「君のレンジは僕の戦略に影響を与えている。もし君がレンジを変えたのであれば、僕は戦略を変えることができる。その結果、君のハンドのEVが変わる(戦略に影響を与える)。」と言っているのである。

全てのプレーヤーは、何かしらの意図を持ってプレイする。それは少なからず、相手の戦略に対して、自身のハンドを最大限に活用しようと努めているからである(勝ちたいからである)。そして、君が自身のレンジを考慮すべき理由は、君のレンジが相手の戦略に影響を及ぼすからだ。例えば、相手が君のことをニットなプレーヤー(ニットなレンジでプレーしている)だと認識したとしよう。そうすると相手は君のバリューベットに対して、ペイオフするのをやめる戦略を取るだろう。またもし、君をブラフ過多だと認識したら、より多くブラフキャッチをするだろう。そうすると、エクスプロイトされないために、君は戦略を変更せざる負えない。

結論、「相手が動的戦略を取ってくる際には君のレンジは君の戦略に影響を及ぼす。」の意味は上記で説明したことが背景にあるのである。

しかし、相手が固定戦略を取ってくるのであれば、君のレンジは君のハンドのGTO戦略に影響を与えない。よって、バランスやレンジに対する相手の認識を気にすることなく、相手の固定戦略に対して自分のハンドを最大化すればよい。ということになる。


■ GTOボットで色々なことを見よう。

君はBBでHU(ヘッズアップ)をしている。ボットは Q95r のボードで33%のベットを行った。

このベットに対する GTO 戦略は次のようになる。

ボットはGTO戦略(固定戦略)を実行している。そのため、次のアクションを行ってもEVロスにはならない。

  • レイズの頻度があるハンドはピュアにレイズできる(好きな頻度でもレイズできる)。

  • 任意の頻度でコールできるハンドを好きな頻度でコールする。

  • 任意の頻度でフォールドできるハンドを好きな頻度でフォールドする。

これらのアクションはインディファレントであり、ボットは君の混合戦略ミスをエクスプロイトするためにアジャストしない。重要なことなので再度お伝えするが、GTO のような固定戦略では混合戦略ミスは咎められず、純粋戦略ミスだけがEVロスを引き起こすからである。


■ 面白いトイゲームを紹介

下記、ボードのBTN vs. BB SRPを見てみよう。

BTN はフロップで 33% ベットし、ターンでは 175% のオーバーベットしている。リバー BB のアクションはどうなるだろうか?

ここで BB は、ハンドの強さに関係なく、レンジチェックを行う。

クアッズであるナッツでも純粋にチェックする必要があることがわかる。ここでは、Q6sでの様々なアクションのEVを確認しよう。下記のとおり、チェックは最も高い EV アクションだ。

これは、BBのレンジがあまりにも弱く、チェックした場合、BTNは多額のチップをポットに投入することが見込まれるからである。従って、クワッズはレンジチェックによって、バリューを最大化する。

もし、BBがリバーに到達し、レンジにはクワッズだけが残っている場合はどうなるだろうか?

BTNが何も戦略変更せず、固定戦略を続ける場合、クワッズはどのようにプレーすべきだろうか? レンジが非常に狭くナッツのみになった今、リード(先にベットすること)を始めるべきだろうか?

① BB はベットを始めるべきか?
② ベットとチェックの混合になるだろうか?
③ それともレンジチェックを続けるべきだろうか?







(答え)BB はレンジチェックを続けるべきである。

BTNはリバーで全く同じGTO戦略を使うことにノードロックされている。前の検討ではチェックが最適であったが、こちらのレンジが純粋なナッツで構成されていたとしても、チェックが最適となるのである。

これは相手には戦略をアジャストさせる能力がなく、こちらのレンジに影響を与えないからである。よって、我々は相手の固定戦略に対して、単純にそれぞれのハンドの利益を最大化することができる。

(筆:これも、「相手が固定戦略の場合、我々は純粋戦略ミスをしなければ良い」を言い表していますね。ということは、「バリュー取れないかも><」とリードベットをするとそれは純粋戦略ミスを犯しているのでこちらのEVロスになりますね。)


■ まとめ

本記事で大事な3つのポイントをまとめると

  • 混合戦略ミスと純粋戦略ミスの違いを理解しよう。

  • 各々のミスがどのように咎められるかを理解しよう。

  • 固定戦略と動的戦略を区別することの重要性を理解しよう。

混合戦略を取る(インディファレントな)ハンドは、対戦相手からエクスプロイトされるのを防ぐために混合していることに注意が必要だ。もし対戦相手が戦略をアジャストできない/アジャストする気がない場合、混合戦略のバランスに拘る必要はない。その代わりに、「相手を最大限にエクスプロイトすること」に集中をすべきである。

(筆:十分にエクスプロイトをかけにくるプレーヤーは少ないため、頻度にそこまで拘り過ぎる必要な無いと考えています。)

この記事が気に入ったらサポートをしてみませんか?