No.1 GTO Wizard Blogの解釈記事【What does GTO aim to achieve?】
本記事はGTO Wizard Blogを私なりに解釈し、友人に説明するならどのように書くかな?と再まとめしたものとなります。
今回の記事は「What does GTO aim to achieve?」になります。
Game Theory Optimal、各頭文字を取って「GTO」と呼ばれる戦略はポーカー界において、支持を得た概念である。GTOは「エクスプロイトされない戦略」であり、固定戦略でもある。
💡 固定戦略とは文字の通り固定された戦略のこと。 例えば、相手が何か戦略を変更してきたからと言って、自身は戦略を変えず、いつも通りの戦略を取ることである。
まず、「GTO」を説明する上で、ナッシュ均衡を理解する必要があるため、ナッシュ均衡の説明をする。
■ ナッシュ均衡の定義
ナッシュ均衡とは、どのプレイヤーも戦略を一方的(←一人だけ戦略を変更する。二人同時には変更しない)に変更したところで、元の戦略と比べ、より良い結果を得ることができない状態のことを指す。
もっと簡単に言うと、今の戦略が最高すぎるため、誰も戦略を変えようとしない。 最大の$10を得られる戦略をわざわざ$5が得られる戦略には変えない。=変える誘因が存在しない。
※ただし、戦略変更をしようとするのは一人だけ。
↓別の表現の仕方もある。↓
各プレイヤーが自分の戦略を公開してプレイしたとしても、それはどのプレイヤーにとっても最高の戦略であるため、各プレイヤーは自分の戦略を変更する意味がない(動機を持たない)。
ポーカーにおける「GTO」とは、このナッシュ均衡の状態を指す。これは最初にも記載した通り、エクスプロイトされない戦略となるのである。
💡 なぜ「エクスプロイトされない。」となるかは、以下の通り。
① GTOはナッシュ均衡の状態である。
② ナッシュ均衡では各プレイヤーは戦略を変える誘因がない。
③ 戦略を変える誘因がない。ということは戦略変更を伴うエクスプロイトはしない。 結論、GTOはエクスプロイトをされない。となる。
また、以下のような記載もよく目にする。
「GTOに対して最も効果的なエクスプロイト戦略はGTOである」
この意図するところは、GTOはナッシュ均衡の状態であり、相手プレーヤーは戦略を変える誘因がない。そのため、GTO戦略に対し、一番高い利益を出せる(エクスプロイト)戦略は同じ戦略のGTOである。という感じ。
次に固定戦略と動的戦略について説明しよう。
■ 固定戦略と動的戦略
GTOの主な利点として、以下のことを挙げることができる。
戦略が固定されていること(固定戦略)
→これは、読み等を頼りにして、意思決定をする必要がなく、知っていれば誰もが同じことをできるのである。
ポーカーに寄せて説明をすると、異なるボードに対してはアクションは様々ではあるが、同じシチュエーションでは常に同じようにプレイする。あるシチュエーションではAのアクション、ある…はBのアクションのようにシチュエーション毎にアクションの最適解が決まっていて、そのようなアクション=戦略を固定戦略という。
一方で、例えば相手の弱みに付け込む/相手が弱そうな顔をしている…等の理由から、自分のアクションを変えることを動的戦略という。これらの内容は包括してエクスプロイト戦略といわれ、相手の欠点に合わせて自身の戦略を調整(よく「アジャストする」とか書かれている)するため、動的戦略なのである。エクスプロイト戦略である動的戦略はGTOではないため、相手からエクスプロイトされうる余地があることに注意が必要である。
GTOにも、エクスプロイト戦略にも良し悪しがあるため、よりよい選択が必要。
まず上記の内容がGTOの触りの触りである。
■GTO戦略とエクスプロイト戦略のよくある話(コラム的に読んでもらえると)
よく以下のようなコメントを目にする。
GTO?GTOだけやってりゃ勝てると思ってるGTO厨はきもい。
エクスプロイトしてりゃ勝てる。
GTOを知らないとエクスプロイトできないんだから、エクスプロイト厨はまずGTOやれ。
Fu〇k GTO
ごめんなさい、特に意味はないのですが書いていて手が止まりませんでした。
私なりの解釈を以下に記載します(異論は多数あるかと思います)。
① GTOを完璧に再現できるのであれば、GTOをしておけば勝てます。
GTOの利益の源泉は相手のミスになります。相手がミスしてくれるのであれば、人間は誰しもミスするものなので、GTOだけやっていれば良いと考えます。
② エクスプロイトが上手い人はエクスプロイトをしておけば勝てます。
相手のミスを突くエクスプロイト戦略。もちろん利益確保はできますね。
結局、きちんとやれば両方の戦略は利益確保できます。なのでどっちの戦略が至高、GTO厨きもい!!は言いすぎです(絶対ダメ)。
ただ、以下の収益性とリスクについては整理をしておくと良いと思います。
【リスク】
GTO < エクスプロイト戦略
エクスプロイト戦略はカウンターエクスプロイト(やり返される)される可能性があります。GTOはエクスプロイトされない戦略であるため、カウンターエクスプロイトの心配はありません。そのため、リスクはエクスプロイト戦略の方が高くなります。
【収益性(リワード)】
エクスプロイト戦略 > GTO
エクスプロイト戦略が上手くはまれば、GTOよりも高い収益性を誇ります。そのため、エクスプロイト戦略を取れるのであれば、エクスプロイト戦略を取った方がいいと思います。また、カウンターエクスプロイトを取ってこないフィールドなのであれば、リスクが低減するため収益性の高いエクスプロイト戦略を取るべきだと思います。
なので、先ほど書いた「どっちの戦略が至高」というよりもリスクとリワードを天秤にかけて、良いと判断した戦略を取れば良いだけのことだと思います。
ただ、エクスプロイトされない戦略であるGTOは戦略の基準となるため、基準を知っていなければ正しいエクスプロイト戦略なのか?の判断が付かないかと思います。
GTOを学ばずにエクスプロイトが至高!!と言っているのであれば、単にその時は上手くエクスプロイト戦略がハマっただけの偶然の可能性も捨てきれないですし、最大のリワードを得られるエクスプロイト戦略を構築できているかも判断が付きません。そのため、勿体ないお化けが出てきます。
しっかりとした判断基準を付けるためにもGTOも学び、そしてエクスプロイトを仕掛けましょう!が良いのではないかな?と思います。
はい、皆様ご察しの通り、私はGTO厨です(エクスプロイト苦手です…)。
この記事が気に入ったらサポートをしてみませんか?