見出し画像

【翻訳】GTOの基本【セオリー】GTOWブログ.31


エクスプロイトとGTOのフレームワーク

ゲーム理論、またはGTO(Game Theoretically Optimal)は、受け入れるか拒否するかの厳格なルールセットとしてではなく、ポーカーについて考え、対戦相手の行動を予測し、自分の意思決定を改善するためのフレームワークとして理解するのが最善である。その目的は、相手のミスに対する強い思い込みを避け、その代わりに相手がどのようにプレイしても強固な戦略を構築することである。そのため、手ごわい相手とプレイするときはもちろん、ミスを予測しにくい不慣れな相手とプレイするときにも役立つ。

エクスプロイトとは、同じ問題にアプローチする異なる方法である。エクスプロイト的なアプローチは、相手が犯すであろう特定のミスを予測し、そのミスを最大限に利用する戦略を練ろうとするものだ。このアプローチは、傾向がよく分かっている弱いプレイヤーに対して最も効果的である。

ジャンケンゲームでは、各プレイヤーは手を使って3つのいずれかを出す。グーはチョキに勝ち、チョキはパーに勝ち、パーはグーに勝つ。エクスプロイト的アプローチとは、相手が何を出すかを推測し、それに合わせて自分の出す手を選ぶことである。ゲーム理論的なアプローチとしては、33%の確率でランダムに出すことを選択する。これにより、相手があなたの行動を予測することは不可能になる。

ポーカーでは、これらのフレームワークは相互に排他的なものではない。実際、GTOは、より利益的なエクスプロイトを編み出すのに役立つ。例えばあなたは、相手がプリフロップで弱いハンドをコールしすぎていることは分かっていても、フロップ後にその悪いハンドをどのようにプレイしてくるかは分からない。というケースがあったとしよう。GTOは、相手がフロップ後にどのような弱いハンドを出そうとも、そのミスから利益を得る事が出来る。

ゲーム理論はなぜ役に立つのか

ゲーム理論とは、不確実な状況下で意思決定を行うためのツールである。対戦相手の意図について情報がない場合、ゲーム理論は、対戦相手が可能な限りうまくプレーし、自分の利益になる行動を合理的に最大限に追求すると仮定する。人間の対戦相手が完璧なプレーをすることはあり得ないが、ほとんどの対戦相手はそれを目指しているため、指針となる他の情報がない場合には有効な仮定となる。

ゲーム理論を理解するための第一歩は、エクスプロイト的な枠組みの外で考えることを学ぶことだ。これは、ベテランプレイヤーにとっては難しいことかもしれない。なぜなら、自分が学んだ、あるいは長い時間をかけて開発した戦略の中に、どれだけ多くの仮定が組み込まれているかに気づかないかもしれないからだ。

多くの場合、これらの仮定は正当なものであり、それに基づいて行動することで、ゲーム理論だけよりも良い結果が得られる。しかし、仮定に当てはまらないケースで仮定に依存しないように、仮定はあくまでも仮定であることを認識することが重要である。

ゲーム理論の実践

有効スタック100BBのキャッシュゲームで、BTNでJ♥ 9♦をオープンし、BBにコールされたとする。あなたはQ♦ 6♥ 5♠のフロップでCベットして、K♠のターンにビッグベットする。相手は再びコールし、リバーは2♣。

ブラフかギブアップか?

もしBBがあなたのいつもの対戦相手の一人なら、この質問に対する答えは簡単かもしれない。Karimは決してビッグベットをペイオフしないので、彼に対しては簡単なブラフだ。Lindaはブラフされることを嫌い、あなたのカードを見るのが大好きなので、ブラフしようとはしないだろう。

もしあなたが相手のことを知らなかったら、"もし相手がフォールドするつもりなら、ターンでフォールドしただろう "とか、"もし相手がリバーでコールするほど強いなら、ターンでレイズしただろう "といった単純なヒューリスティクスに頼るかもしれない。

これらはすべてエクスプロイト的な意思決定プロセスである。これらは相手の意図を推測し、それに従ってプレーすることに依存している。推測が正しければ、あなたが有利になる。しかし、もしあなたが間違った推測をした場合、つまり、カリムがあなたのブラフにうんざりしていたり、リンダがやめようとしていて大損するリスクを冒したくない場合、たとえ相手がそれに気づいていなくても、相手はあなたをエクスプロイトする。

エクスプロイトされない、あるいはゲーム理論的なアプローチとは、相手に簡単にあなたを利用する機会を与えないようにすることである。相手が何をするか予測するのではなく、あなた自身のプレーを予測不可能にし、相手にとって最善のプレーが一つもないようにすることに重点を置くのだ。

予測不可能とは、ランダムという意味ではない。Q♦ 6♥ 5♠ K♣ 2♣ のボードで最後に43以下の乱数を取ったらベットすべきである。ナッツをチェックするのは確かに予測不可能だが、利益にはならない。

同様に、K8を持っていたらチェックすべきである。ブラフするには強すぎるが、バリューのためにベットするほど強くない。このハンドでは予測不可能である必要はなく、チェックし、ショーダウンでエクイティを実現させればよい。

適切なハンドを適切な頻度でブラフすることが、あなたを予測不可能にし、対戦を難しくする。

対戦相手は、あなたが強いハンドでは必ずベットし、中くらいのハンドでは必ずチェックし、時には慎重に選んだブラフをベットすることを予測できるかもしれないが、この情報だけでは相手にとって最善のプレイはわからない。あなたがベットするとき、相手はあなたが今回どのタイプのハンドを持っているかわからないからだ。従って、相手があなたのブラフには勝つが、あなたのバリューベットには負けるハンドを持っている場合、あなたに勝つ方法はない。あなたの戦略は、明らかに正しいたった一つの最善のプレイを相手にさせないのである。

明らかにベットやチェックを好む手もあれば、あなたのJ♥9♦のように、ベットすることもあればチェックすることもあるのがわかるだろうか?これは、「相手に予測を立てさせないこと」の結果だ。K8と違って、J9には「正しい」プレイはない。あなたができる最善のことは、この状況であなたがベットする他のすべての手札と組み合わせて、平凡なブラフキャッチャーを持つ相手に良い選択肢を与えない適切な頻度でブラフをかけることである。

以下は、GTOウィザードがJ9で時々行うようアドバイスしているような、84%のポットベットに対する相手の反応である。K8のようなBBのトップペアでさえ、このベットに直面すると良い選択肢がないことに注目してほしい。コール、フォールド、レイズは全て等しく望ましくない。

チェスには「フォーク」という概念がある。相手の駒を1つだけ脅かしても、相手はその駒を安全な場所に移動させればよいので、難しい決断を迫られることはない。フォークを仕掛ければ、一度に複数の駒を脅かすことができ、相手には魅力的な選択肢がなくなる。相手は1つの駒を安全な場所に移動させることができるが、もう1つの駒を失うことになる。

このリバーベットも同じようなことをする。相手がK8をフォールドすれば、あなたのブラフに負けるリスクがある。相手がコールすれば、あなたのバリューベットにペイオフしてしまうリスクがある。相手に特定の行動を強制することは出来ないが、エクスプロトされないポーカーの重要な目標は、相手に魅力的な選択肢を与えないことで、相手の決断を困難にするようにプレイすることである。

インディファレンス

上のGTOウィザードのソリューションにある混合戦略は、難しい決断を表している。適切な戦略を取れば、これらのハンドで相手が特に利益的なアクションをする事を否定することができる。相手が良いハンドを持っているときは、あなたが何をしようと相手は儲かる。しかし、賢いプレイをすれば、相手の勝ち額を制限することができる。

エクスプロイト不可能なプレイは、2つ以上のオプションが同じEVを持つ場合にのみ、それらのオプションを混合する。どの選択肢も他の選択肢より良くも悪くもない場合、プレーヤーはそれらの選択肢がインディファレンスである。

エクスプロイト不可能な戦略の目標は、EVを最大化することである。インディファレンスとは、その目標を達成するための手段である。相手が特定のミスをすることを想定していない場合、あなたにできる最善のことは、相手が特に良いプレーをする機会を奪うことだ。インディファレンスについてはこちらの記事で詳しく説明している。

混合戦略と純粋戦略

すべての決定ポイントで、すべてのハンドで対戦相手をインディファレントにすることはできない。時にはベストプレイがあり、ゲーム理論はそのような時に対戦相手がそれを必ず見つけると仮定する。このようなベストプレイは、ソリューションでは純粋戦略として表示され、プレイヤーが毎回取るべき行動となる。繰り返し覚えておいて欲しい: 予測不可能とはランダムという意味ではない!

混合戦略は、あるハンドであるアクションを取ることもあれば、別のアクションを取ることもあり、プレイを「混合」させるものだ。いずれにせよ、あなたは最高のハンドを持っていなかったので、このようなハンドを欺くようなプレイをすることに何のコストもかからない。相手の戦略についての洞察がない場合、あなたは両方(または3つ全部、または4つ全部、または5つ全部)が同じEVを持つことを期待出来る。

頻度のミス

混合戦略は、その選択が恣意的であることを意味するものではない。むしろ正しいプレーは相手の戦略に大きく依存する。

対戦相手が完全にエクスプロイト不可能な戦略をとった場合のみ、混合戦略におけるすべての選択肢のEVは同じになる。対戦相手とのわずかなズレさえ予測できれば、ある選択肢の方が一方的にEVが高くなり、一貫してそれを選ぶべきである。

上記の例では、BBのエクスプロイト不可能な戦略は、このリバーベットに対してレンジの48.9%のハンドをフォールドする必要がある。もし相手が49%のハンドをフォールドするのであれば、J9でブラフをかけた方がチェックよりも厳密には有利である。それほど良くはならないが、それでも毎回ブラフをすることでEVを増やすことができる。

そうすることで、あなたは自分の攻略不可能なGTO戦略から外れることになる。あなたはエクスプロイト的な枠組みの中で、相手のミスを想定して行動することになる。その仮定が正しければ、あなたは優位に立てる。もしそれが間違っていれば、エクスプロイト不可能なブラフの頻度を守るよりも不利になる。

これは頻度のミスの例である。J9はブラフのハンドの候補として悪くない。あなたの間違いは、それを使ってブラフをかける頻度が高すぎたことであり、この間違いがあなたに損をさせるのは、エクスプロイト的に高い頻度でコールしてくる相手に対してだけである。その代わりに相手がエクスプロイト的に高い頻度でフォールドすれば、この「ミス」はあなたを儲けさせるだろう。

もし相手があなたの戦略を知っていたり推測していたりすれば、K8のようなギリギリのハンドでさえ難しい判断に追い込まれると考えるのはミスである。あなたがブラフを多用していることを知っていれば、相手は自信を持ってコールすることができる。

このような間違いは、習慣的にコールしすぎるプレイヤーに対しても損失を出す。このようなプレイヤーは、あなたがミスをしていることに気づかずに、あなたのオーバーブラフのミスから利益を得ている。ジャンケンゲームでいつもグーをだしていたとしたら、あなたの戦略を知っているプレイヤーに負けるだけでなく、あなたがグーを出すのが好きなのと同じくらいパーを出すのが好きなプレイヤーにも負けるだろう。

純粋戦略のミス

純粋なミスとは、ベットするのに適していないハンドをベットすること(またはチェッ クするのに適していないハンドをチェックすること)である。Q♦ 6♥ 5♠ K♣ 2♣ の例では、K8 はブラフをするには強すぎるが、価値のためにベットするほど強くない。ベットしても相手に難しい判断を与えることはないだろう。相手はほとんどのより悪いハンドをフォールドし、より良いハンドでコールするだけであろう。

KKをチェックすることも相手に難しい決断を与えることはない。ベットをすることにより、フォールドしてブラフのリスクを負うか、コールしてこのような強い手に負けるリスクを負うか、厳しい選択を迫られるような多くのハンドに安くショーダウンさせるだけである。

頻度のミスと違って、純粋戦略のミスは相手の戦略に特に敏感ではない。このようなミスは、自分ではエクスプロイトしてこない相手に対しても損をしてしまう。KKをチェックすると、相手がコールしたであろうベットを逃してしまうし、K8をベットした場合、無料でショーダウンできたのに、より良いハンド相手に不必要にお金を失うことになる。

純粋なミスであっても、ゲーム理論の枠組みの中だけのミスである。これらの「ミス」は、理論的には、対戦相手自身が適切な種類のミスを犯した場合、エクスプロイト戦略の有益な部分となり得る。例えば、多くの悪い手でリバーベットをコールするようなコールステーションに対しては、GTOウィザードでは純粋なチェックと表示されていても、K8をベットすることは利益を生むだろう。

ゲーム理論では、この手でベットをする必要はない。むしろ、そうしなければならない正当な理由がない限り、チェックはあなたのデフォルトのプレイであるべきだと教えてくれる。

混合戦略には選択肢があり、デフォルトのプレイはない。相手の戦略について何も知らなければ、選択肢はどれも等しいEVを持つ。相手がどちらかに逸れるかもしれないという予感さえあれば、あなたは他の選択肢よりも一つの選択肢を優先することができる。純粋な戦略から逸脱するには、相手側がより大きなミスを犯さなければ正当化されない。

結論

ゲーム理論は道具である。どんな道具でもそうであるように、適切な方法で、適切な状況で使用することで価値を発揮する。道具を使うには、その仕組みを理解しなければならない。
ポーカーの根底にあるゲーム理論を理解していなければ、ポーカーを全く理解していないことになる。せいぜい、試行錯誤の末に特定のタイプの相手にだけに有効な戦略を編み出す事が出来る程度だろう。よく遭遇するシチュエーションでは快適かもしれないが、あまり馴染みのないスポットでは苦戦するだろう。
ゲーム理論を使うといっても、この記事のようなチャートにあるような戦略を完璧に実行する必要はない。インディファレントという概念を理解し、相手がどのように決断するかを推測するのではなく、相手に厳しい決断を与えるという観点から考えることを学ぶだけで、不慣れな状況をよりよく理解し、パフォーマンスを発揮するのに大いに役立つだろう。

この記事が気に入ったらサポートをしてみませんか?