見出し画像

No.17 GTO Wizard Blogの解釈記事【Poker subsets and abstractions】

本記事はGTO Wizard Blogを私なりに解釈し、友人に説明するならどのように書くかな?と再まとめしたものとなります。
今回の記事は「Poker subsets and abstractions」になります。

承認欲求を満たすために是非「♡」をお待ちしております。
X(Twitter)のフォローもお待ちしております。


今回の記事はかなりニッチな内容となる。正直、読まなくてもポーカーはできるので、時間が余りに余って仕方がない…!!という方は読んでいただけると嬉しい。

さぁ、息子が隣でガン泣きしていても、しっかり座学していこう。


■ 導入

我々が良くプレイするノーリミットホールデムは非常に複雑なゲームだ。本ゲームを正確に表現しようとした場合、「非常に」「非常に」「非常に」多くのノードで構成される。これをソルバーでそのまま解こうとした場合、膨大な時間と膨大な資金を要することだろう。

そうした背景から先人達は計算量を最小限に抑えるために、より単純なゲームモデルを作成しようと努めてきた。こうしたゲームの単純化が本記事で説明していく「抽象化」なのである。


■ 抽象化とはなんだろうか?

特に改めて書く必要はないかもしれないが、「抽象化」とはポーカーをシンプルに考える方法である。ポーカーは非常に複雑であり、解くためにはシンプルにする必要がある。これらは例えば以下の方法が実行される。

  • フロップのサブセットを使用して、フロップ数を減少させる。

  • 同様のハンドクラスをまとめてバケット化する。

  • 利用可能なベットサイズを制限する。

  • ベッティングキャップを適用する。


■ サブセットとはなんだろうか?

ホールデムには22,100通りのフロップが存在する。その内、1,755通りのフロップは戦略的に異なる。

(筆:7♡7♤7♧と7♢7♡7♤等の戦略的に同等と見なせるフロップをまとめると、1,755通りまで抽象化できるってことですね。それでも我々が勉強するには膨大すぎますね。)

これは膨大な数であるため、先人たちはこの数を減らす取り組みをしてきたのである。

その取り組みの一つとして「サブセット」が挙げられる。「サブセット」とは、戦略的に同等と見なされるフロップの集合である。

サブセットの考え方は「プリフロップを解く。」ことにも繋がる。なぜならば、プリフロップは独立して解くことはできないからであり、プリフロップがあってこそのポストフロップだからである。我々がWizard等で確認できるプリフロップ戦略は、ポストフロップの EV を最適化しようとした結果として生成される。この生成されたプリフロップレンジは、後のストリートにおいて、個々のハンドで最も多くの+EV シナリオが作成できるように構築されている。

※前述したように戦略的に異なる1,755のフロップが存在するため、プリフロップのゲームツリーはポストフロップのゲームツリーよりも、指数関数的に大きくなる。


■ Wizardでサブセットを使ってみる

GTO Wizardには、 1,755通りのフロップ、全てに対するソリューション用意されている。また25、49、85、184 フロップのサブセットが提供されている。

以下の方法でサブセットが利用できるので試してみよう。

① サブセットを利用し、ソリューションに対するトレーニングを容易にする。

GTO Wizardトレーナーでは、ボードをフィルターすることができる([設定] > [ボード])。ユーザーはフロップのサブセットを選択でき、そのサブセット内のフロップのみが配られることになる。サブセットが少ないほど、パターンの研究と記憶が容易になるだろう。

② サブセットを使用して、レポートをより簡単に視覚化する。

GTO Wizardは、集合分析を確認することができる。これらのレポートは、ヒューリスティックやベットの傾向を見つけるために有用だ。これら集合分析にサブセットをフィルターとして適用し、表示するフロップ数を減らすことができる。これにより、様々なスポットの概要を把握することができるだろう。

※サブセットを適用すると、テクスチャによるベットサイズ傾向の精度が低くなることに注意。


■ ベットサイズの制限

ノーリミットホールデムに複雑さをもたらす特性は、いつでも任意のベットサイズを使用できることである。

実は「ヘッズアップリミットホールデム」は完全に解かれてしまったゲームである。つまり、無敵の戦略がPCによって計算されたのである。ではいつの日かノーリミットホールデムも、、、と思うかもしれないが、このベット制限がなくなることによって、膨大な数の追加ノードが作成される。だから、現在のテクノロジーではノーリミットホールデムを解くことは不可能だ。

実際、ソルバーはベットの選択肢を制限している。人々がゲームをモデル化するためにベットの選択肢を選ぶと、アルゴリズムがモデルに対しての計算をするのである。

GTO Wizard の100BB ヘッズアップキャッシュゲームモデルでは、SBは33%、67%、100%、150% を c-betをするか、オールインを選択できる。

(筆:実際はどんなベットサイズでも可能ですけどね。)


■ ベットのキャップ

ベットのツリーを簡略化するために、ストリート毎のベット、レイズの最大回数が制限されている。GTO Wizardの場合では5回の上限が設けられていて、最後のベットはオールインが選択されるようになっている。

上記は 200BB ブラインドヘッズのSRPである。SBで50%の4betに直面する場合、フォールド、コール、またはオールインに限定される。オールイン以外のサイズに5betすることはできない。


■ バケット化

バケット化は、類似したハンドクラスをひとまとめにするプロセスだ。例えば、AKでの A39は、「BDFDのないトップペア、グッドキッカー」に分類できる可能性がある。このカテゴリに分類される全てのハンドは 1つのハンドとみなされ、同じようにプレイできるだろう。実際効率的なバケット分類が行われた場合、プリフロップでほぼ完ぺきな結果を示した。

(筆:私はよくEQバケツを確認することがあります。これはEQ毎にハンドをバケット化したものになりますね。)


■ サブゲーム

サブゲームは、実際のポーカーを小規模に表現したものである。このサブゲームには、ゲーム空間の複雑さを軽減するためにいくつかの抽象化が行われている。

(筆:トイゲームのことですね。)


この記事が気に入ったらサポートをしてみませんか?