【翻訳】なぜ私のソリューションはGTOウィザードと一致しないのか？【セオリー】GTOWブログ.6

てっぺー/Liz3rd

2023年12月13日 18:28

あるスポットにおいてあなたが独自のソリューションを得て、GTOウィザードと比較したところ、戦略が同じではないことに気づいた。ここで何が起こっているのか？全く同じ結果が得られるはずなのでは無いのか？

これは、GTO Wizard Discordに寄せられる最もよくある質問の1つである。

この記事では、初期パラメータやソルバーのアルゴリズムを少し変えるだけで、出力される戦略が劇的に変わることについて探っていく。

同一条件で比較する

ソリューションを比較する前に、まずは同じ条件で比較しているかを確認してみよう

以下の5つの点を確認してみよう：

同じプリフロップレンジを使っているか？
同じベットサイズを使っているか？
同じレーキストラクチャーを使っているか？
同じSPRを使っているか？
十分な精度で解いたか？

初期パラメーターの小さな変更が、解の出力を変えるバタフライ効果を引き起こす可能性があることを認識することが重要である。ソルバーはカオス理論を具現化したものだ。この記事の前半では、開始パラメータが異なると戦略が劇的に変化することを探っていく。

全く同じパラメーターを使ったらどうなるか？ソルバーのアルゴリズムが異なれば、似たようなスポットでも異なる戦略を生み出す可能性があることを知ると、驚くかもしれない。しかし、だからといって一方の戦略が優れているということにはならない。実際、全く異なるように見える戦略でも、EVやエクスプロイトされる可能性が極めて近いことがあり、またそうなることも多い。

初期パラメーターの違いが戦略をどう変えるか

例１.BvBにおいてリンプありorリンプ無し

プリフロップのレンジが異なれば、ポストフロップの戦略も異なる。プリフロップのベットサイズが異なる場合、同じレンジを使っていない可能性がある。

例を挙げよう。SBのオープンレンジをリンプの有無で比較してみよう。左はGTOWの500NL100BBのGeneralソリューション、右はシンプルソリューションである

リンプ戦略(緑)はレイズインするレンジをわずかに分極化させている。右の戦略では、左のオープン戦略に比べて、9-T領域に中位のカードが比較的多く、ロー/ハイのカードがわずかに少ない。

例えば、ジェネラルソリューションは以下のQT8フロップを55%の確率でチェックするのに対し、シンプル・ソリューション（リンプせず、中位のカードが多い）は46%しかチェックしない。

例２.BTN vs SB 3bp 3betの額による違い

ここでは、AKKrにおける500NL ComplexソリューションとGeneralソリューションのSB側のフロップCbet戦略を比較する。

Complexソリューションはより小さい(10BB)3ベットサイズを使い、よりリニアなレンジを使う。小さい3betはBTNが広くコールする原因となる。さらに、Complexにはフロップの小さなベットサイズが多くあり、このようなフロップでよく使われる。これらの要素が相まって、ComplexソリューションではSBがより頻繁にCbetする（Cbet頻度72%）ようになる。

Generalソリューションは、ややポラーでトップヘビーなレンジで、大きめ(12BB)の3ベットサイズを使う。サイズが大きいため、BTNはタイトにコールすることになる。さらに、ジェネラルで利用可能な最小のベットサイズは33%ポットであり、これはより多くのチェックを導く。これらの要素が相まって、SBはより頻繁にチェックするようになる（Cbet頻度48%）

例３.極小サイズのベットの有無によるBTNvsBB SRPの集合分析

この例では、GeneralソリューションとBasicソリューションのフロップCbetの頻度を比較している。

Generalソリューションでは、フロップのCbetサイズを最低33%に設定し、ベット頻度を減らしている。BBはより大きく、よりポラライズされた3ベットサイズを使い、プリフロップのコールレンジをわずかに強くしている。戦略的に異なる1755のフロップ全てにおいて、BTNは約53%の確率でベットしている。

Basicソリューションでは、最低27%のフロップCbetを使い、ベットの頻度を高めている。BBはまた、プリフロップでより小さくリニアレンジで3ベットを使い、コールレンジをやや弱める。戦略的に異なる1755のフロップすべてにおいて、BTNはより頻繁にベットしており、合計で約64%の確率でベットしている。

話を進める前に、よく知られている認知バイアスについて触れておこう。ポーカープレイヤーは、ベットする回数が多ければ多いほど、自動的にEVが高くなるとか、良いソリューションであると考えるように仕向けられている。しかし、そうではない。

例えば、AK6rのようなフロップ（BTN vs BB SRP）でソルバーに小さなベットサイズしか与えなかった場合、ソルバーは高い頻度でベットする。その後、小さいベットサイズに加えてオーバーベットを加えると、ソルバーはすべての小さいベットをオーバーベットに移し、チェックの頻度を大幅に増やします。言い換えれば、新しいオーバーベット戦略の方がEVが高いにもかかわらず、より多くチェックすることになる。

GTOウィザードのソリューションを再現する

ソルバーのカオス理論を学んだところで、GTOウィザードのシミュレーターを再現してみよう。

この例では、JT5のUTG対BBのSRPを見ている。私は500NL General 2.5xのソリューションを使っている（UTGは2.5BBにオープンした）。以下の手順に従って、あなた自身のソルバーを使ってソリューションを再現してみよう。

ツリーの設定

上のリンクにある Ranges タブから範囲を直接コピーする。
スタックとポットサイズを設定する：それぞれ5.5BBと97.5BBとする。
後のストリートでのオーバーベットを含め、ソリューションと同様のベッティングツリーを使用する。
レーキを5%の0.6BBキャップに設定する。
精度を0.3%ポットに設定する。

Piosolverを使うなら、これらのパラメータをコピーしてツリービルダーに貼り付けるだけでよい。これはGTOウィザードのツリーの正確なレプリカではない。例えば、このボードでは使用することのないドンクベットは省略した。
より小さなツリーが必要な場合は、使用しないものや戦略的に似たようなサイズのものを省いてみよう。経験則として、リバーの複雑さはターンの複雑さよりもフロップに与える影響が小さい。別の言い方をすれば、遠くのノードの方が現在の判断に与える影響は小さい。

異なるソルバーの結果を比較する

この実験では、上記の正確なパラメータを与えて、GTOウィザードの解とGTO+およびPiosolverの出力を比較していく。

GTOウィザードのソリューションは以下となる：

GTO+のソリューションは以下のようになる

Piosolver（CFRアルゴリズム）では以下のようになる

以下が比較の画像になる

私がこのボードを選んだのは、多くの異なる戦略が同じような期待値を持つ場所だからだ。これら3つの戦略はすべてプレー可能である。これら3つの戦略はすべて、最大で0.017BB（スタートポット5.5BBの0.3%）でエクスプロイトできる。

正しい戦略は一つではなく、複数あることが多い。

この概念を理解するために、例えを使おう。半円を思い浮かべて欲しい。その円の各点は異なる戦略を表している。すぐ隣にある2つの点は、同じ期待値でもまったく異なる戦略を表しているかもしれない。各点の高さは、その解決策がどれだけ「優れている」かを表している。拡大するにつれて、どの戦略が優れているかを見分けるのは難しくなっていく。

https://blog.gtowizard.com/wp-content/uploads/2022/10/why-doesnt-my-solution-match-gto-wizard-image-13-1200x618.gif

もしあなたが３つの異なるアルゴリズム全てに１つの戦略を出力させたければ、超高精度で計算させる必要があるが、GTOウィザードのような大規模なソリューションライブラリや、人間が出来るレベルのプレイにおいて、再現の可能性をはるかに超えている。その上、同じ期待値を持つ均衡が複数存在する可能性があるため、同じ出力が得られる保証は無い。

簡単に言うと、GTOの解は、実際には、常に一つの明確な戦略というわけではない。複数の正しいプレー方法があり得るのだ。

この概念は、ほとんどすべての戦略ゲームに存在する。例えば、超高精度（47ply）に解かれたチェスの局面がある。ソルバーは3つの手、d6、e6、Nf6がすべて同じ期待値0.0であると計算している。もちろん、これら3つの手にはそれぞれ異なるアイデアと戦略がある。しかし、どれも最高レベルでもプレイ可能な手である：

これらから何を学ぶべきなのか

いくつかのスポットには、多くの同等の戦略がある。入力されたパラメータが正しくいモデルである限り、あなたが学ぶべき正確な解がどれか、ということはそれほど重要ではない。

あるノードの正確な戦略に固執するのではなく、次の3つのことに集中しよう：
・選択した戦略をいかにうまく実行し、貫くか。
・基本となるGTOの原則を理解すること。
・GTO戦略を推進する潜在的な搾取力学を理解する。

まとめ

GTOソルバーの出力のカオス的な性質を初めて知ったとき、少し落胆するのは普通のことだ。ただでさえ難しい努力に、また新たな複雑さが加わったように感じるからだ。しかし、あなたのゴールは解答を暗記することではなく、これらの戦略の背後にある根本的な理由を理解することだからである。

丸暗記は不可能なだけでなく、驚くほど効果がない。その代わり、根本的な原則に焦点を当てれば、様々なスポットでどのようにレンジを構築すればいいのか、より良く理解できるようになる。さらに、原理原則を学ぶことは、エクスプロイト的な調整を行うためにも必要である。

GTOウィザードは、異なるレーキ構造、ベットサイズ、スタックの深さに対して何十ものソリューションを提供する。これを活用するのだ。似たようなソリューションを比較し、なぜ戦略が変わるのかを考えるのだ！ソリューションがどのように違うのか、そしてその変化がどのように相互作用して異なる戦略を生み出すのかを自問しよう。「何が」ではなく「なぜ」を理解するように努めよう。解決策を比較対照することは、最終的にGTOをより深く理解することにつながる。

この記事が気に入ったらサポートをしてみませんか？