【River model】Wpolarとindifferent
今回は上級者の方に向けて、筆者が有用と考えるtoygameであるWpolar-gameについて解説をしていこうと思います。
内容は他の記事に比べて高度です。
具体的には、Geometric betsizeのnoteにおける indifferentの作り方を理解できている程度が要求されているとお考えください。
完全に記事の内容を再現できずとも、その結果と思考自体は非常に有用なものなので是非咀嚼しながら読んで頂ければと思います。
今回は記事の内容が多少高いので、読む前に本noteを通じて理解すべき内容を確認しておきます。
1.Wpolar-gameというmodelを理解すること。
2.toygameの有用性を理解すること
3.indifferentと頻度構築の関係性を理解すること
準備はよいでしょうか?
Wpolar-gameとは何か
簡単な例示
当記事で扱うWpolar-gameという用語は筆者が考案したRiverのtoygameの名称であり、当然意味不明だと思います。
このモデルを直感的に理解するために実践的な例を見てみましょう。
以下のようなstars50nlにおけるシチュエーションを考えてください。
貴方はBTNのopenに対して
BBでA7のスペードスーテッドを持っていました。
BoardはK64tt
BTNのVillainは33%の定番cbを打ってきました。
貴方はナッツフラッシュドローとバックドア、ワンオーバーカードを活かして50%raiseを実行します。
すると相手はcallしました。
Turnカードは素晴らしいことにTdの完全なラグです。
貴方は乱数を見てpotoverCBを実行しますね!
さて、リバーカードは
Jsです。残念ながらラグではなかったものの貴方は都合のいいことにナッツフラッシュドローを完成させました!
Turn-Riverのgeometricラインですから、もちろんRiverはAll in できるハンドですね!ありがたくKs持ちや下のフラッシュ、セットに向けて突っ込ませてもらいましょう。
以上のシチュエーションについて、geometricの概念もしっかり理解して、違和感なく理解することができましたか?
問題ないという方はこのまま、問題があるという方は上のシチュエーションを今一度読み自分の考えを纏めた上で次に進んでください。
実は上の説明で違和感を持てなかった方は、レンジ戦略の理解が足りていません。
もちろんあなたのハンドはAIに十分耐えうるハンドなのですが、あなたのレンジはAIに耐えられないのです。
ハンドとレンジの記事の中で
レンジが配られていると考えて、戦略を構築し、ハンドをプレーする
という内容を書きました。
今回の状況で、
Riverのレンジが配られていると考えて、Riverレンジの戦略を構築し、ハンドをプレーしましたか?
GTOWizardの解を見てみましょう
レンジ全体でAIを行っているハンドは1.3%しかなく、ほとんどが安ベット、A7に至ってはピュア安ベットですね。
つまり
TurnまでpolarizeしていたがRiverは止まってレンジ全体で安ベットをしろ
といっています。
なぜこのようなことが起きるのでしょう。
それを理解するカギがWpolar-gameとなります。
今一度お互いのレンジを想定して、戦略を考えてみてください。
閑話休題 ~piosolverって何?って方へ~
少し休憩をします。
(本題のスムーズな進行を期待する方は読み飛ばしても構いません)
pokerの業界にはpiosolverという計算機があり、よくpioとWizardって何が違うのか?という話を聞かれます。
今回はpiosolverという非常に優れたソフトがどのようなものか少し説明しようと思います。
piosolverとは簡単に説明すると
いろんな設定をするとそこから(疑似的な)GTOを生み出してくれる機械のことです。
いろいろな設定というのは戦略を組み立てるために必要な条件のことで、
今回のリバーについて考えるなら
1.まずお互いのレンジとスタックとボード
2.bet sizeの候補
3.rakeの設定
そして最後に計算機ですから、どのくらいしっかり計算してもらうのかということで、
4.計算精度
なんかを(ほかにもいろいろあります)決めると頑張って計算してくれて
計算結果を出してくれます。
(雑に言えばWizardというのはこの計算結果を一覧で見やすく置いてくれてるだけですね。)
piosolverの結果を見るとWizardとは微妙に違うことがわかると思います。
基本的にWizardは計算精度が低いので、こういった細かいシチュエーションを計算する場合はpioにレンジを入れて精度を上げて計算をするとより(ある意味で)正しい結果を得ることができます。
このツールは非常に有用であり、GTOWizardのような結果一覧表よりはるかに多くのことを学べます。しかし計算機ですから、性能の良いパソコンが必要ですし、計算結果を保存するためには容量もたくさん必要です。ここら辺は別の方も解説してくださっていますので、今回の話題に戻りたいと思います。
RiverでAIをするという戦略が悪いのかについて考えてみましょう。
つまり、RiverのOOPの戦略をall inのみにします。
(all in or checkということです。)
するとA7sはどうなるでしょうか?
おめでとうございます。pureでall inしろとのことですね。
じゃあall inしても良いじゃないかと思うかもしれません。
しかしながらレンジ全体のEVを比べてみると
上のようにAllin戦略では100点以上(1bb以上)のチップを捨てることになると判ります。このようなものを戦略によるEVlossといいますが、これが大きいか小さいかはいったん無視して、
同じレンジであっても戦略の構築によってEVが変化する
ということがわかると思います。
そして今回は安ベット戦略を学ぶことでEVの向上を図れるわけです。
これこそがpokerが絵合わせゲームではない要因なわけです。
少し脱線しましたが、piosolverとは上のようにGTOを理解するため設定を変えながら様々な計算が行えるツールであり、GTOWizardはざっくりとその結果が一覧でまとまってるだけのものです。
閑話休題終わり
Wpolar-gameとは
さてなぜこの状況
で先ほどのような(all inではなく安ベットを広く行う)戦略
をGTOは構築するのでしょうか?
これを理解するためにはRiverのたがいのレンジを想定することが非常に大切です。そのためにレンジエクスプローラを見てみましょう。
分かりやすくするために4つのEQ群に分割して考えます。
BBが青線,BTNが緑線です。
左下から順番に
1,2,3,4と名前を付けておきましょう
今回は貴方は奇跡的に最強のAハイフラッシュを持っていますがそれはあくまで奇跡であって、メインのレンジは
になります
この状況を簡易的に理解するためにmodelを作成しましょう。
piosolverを用いて
ボードを以下のように
OOPのレンジを以下のように
IPのレンジを次のように
設定します。
ハイカードが良いほど強いようにしているので元のように
となっていることがわかると思います。
SPRは1として
betsizeは安いbetからAIまで用意しましょう
するとOOPの戦略は
となります。
OOPの安ベットに対してIPは
上のようにdefenceを行います。AIが返ってくると
OOPはブラフキャッチを行います。
この結果を有機的に解釈しましょう。
OOPは
1群,3群のポラーレンジを活かして相手の2群をpolarに苛めます。
これに対しIPは2群でブラフキャッチをしつつ2群,4群でOOPのpolar上側であった3群を苛めています。
betsizeが小さくなるのはIPの強polarレンジを恐れながらもOOPの弱polarレンジを活かしてEVを高めるためというわけですね。
このような両者のレンジがお互いにpolarになっているmodelを
Wpolar-game
と呼んで、
1群を弱Air
3群を弱Nuts
2群を強Air
4群を強Nuts
と呼ぶことにしましょう。
このモデルを理解すると元の議論は
レンジ全体でWpolar-gameのようなシチュエーションであるから、奇跡のNutsを弱Nutsとして処理し、レンジ全体で相手のTurnまでのbluff catcher(すなわち強Air)を苛めよう。
として実践することができます。
このようにRiverのmodelをあらかじめ持っておいて、現在のシチュエーションがどのmodelに近いのかを考えるとRiverの解像度を上げて戦略構築することができます。
Indifferentと頻度構築
OOP 強polar model
さて、少し面白いことをしてみましょう。
ここから当noteは第二章に入るので、疲れた方は一度お休みください。
OOPとIPのレンジを交換してみます。
OOPは強polarレンジを
IPは弱polarレンジを
それぞれ持っているとしましょう。
お互いの戦略はどうなるでしょうか?
node1:OOP戦略
node2:IP戦略(vsOOP check)
node3:OOP戦略 (node1→node2時にIPがAll in)
node4:IP戦略(vsOOP All in)
画像が四つも並んで大変ですが、まずnode1とnode4について考えてみましょう。すなわち、
OOPがAll inをしてIPがブラフキャッチをする
シチュエーションです。
まずnode1を見ます。
ここでOOPのバリューブラフ比率というのはどのように決めればよいでしょうか?
(ポラライズの記事を思い出してください。)
betする場合、IPの弱Airは本当にゴミですから、
OOPはIPの弱Nutsをindifferentにするようにbetします。
IPからすれば、OOPのバリューブラフ比率を見てそれがどちらかに偏っていれば全てfoldしたり全てcallしたりすることでExploitが可能です。
何らかの群が適切にIndifferentになってないのであれば、それはExploit可能な頻度構築になっている
というわけです。
裏を返せば
頻度構築というものは相手の特定の群をindifferentにする
ことを目標として構築します。
すなわちここから、
OOPの(強Nutsのbet頻度に対する)強Airのbet頻度
→IPの弱Nutsにおけるcall/foldをindifferentにする
という構図が生まれます。
さて、では
OOPの強Nutsハンドのbet頻度はどのようにして決まってますか?
これはIPのなにがしかをindifferentにするために頻度構築をしています。
piosolverを用いて何をindifferentにしているのかを見てみましょう。
OOPの強Nutsのbet頻度を上げます。
上述の通り強Airのbet頻度を適正にすれば、IPの弱Nutsのcall/foldをindifferentにできるはずです。
以上のようにnode1をlockすると
node4でindifferent群を生成できています。しかしながらこの時のnode2(OOP check)を見ると
弱Nutsがpureにbetを開始しています。
まさにindifferentだった群がpure戦略に変更しExploitをしていますね!
このことから
OOPの強Nutsのbet頻度
→IPの弱Nutsのcheck/betをindifferentにする
ということがわかりますね!
「ほへー、でそんな議論をこねくり回して何が楽しいの」
と思われるかもしれませんが、こういった議論こそがpokerにおいて考えるべき事です。
貴方がIPで弱Nutsを持ってるときにOOPにチェックされたと考えてください。
貴方のハンドはcheck/betについてindifferentです、がだからと言ってどっちでもよいなんてことはないのです。
もし上の事実を学んだことがあれば、
OOPの強Nuts打ち出し頻度がGTOより過多ならbet、過少ならcheck
をすることによってExploitすることができる!
と即座に理解できますね。
GTOというのは緻密にindifferent群を作成しExploitされない戦略を組み立てます。しかしながら人間にそれは不可能で、必ずほころびが生じます。
その綻びはこちらの特定のハンドをindifferentにしなくなり、Exploitの隙を与えます。ここを突くことこそが理論に裏打ちされたExploitなのです。
漫然と、「相手がコーラーだから~」というような理由でなく、相手のどの頻度がこちらのどのEVにどう影響を与えるのか理解しそれによって戦略を考えると、pokerがさらに面白くなるはずです。
練習問題
上記のシチュエーションについてindifferentを深く理解するためにいくつか練習問題を置いておきます。
考えてみてください。
Q1. node4においてIP弱Nutsは何故indifferentか
Q2.node3においてOOP強Airは何故indifferentか
Q3.node3においてOOPの頻度構築の目的は何か
Q4.node2の弱Nutsがbet過多の相手に対して適切なExploitは何か
最後に
お疲れさまでした。
非常に長い記事で疲れたかと思いますし、面白いと感じる方がどの程度いるか怪しいですが、かねてよりtoygameの記事を書いてほしいという要望を頂いていたので今回はこのような記事となりました。
今一度冒頭の目標が達成されたかを考えていただければと思います。
そして面白いtoygameがあればぜひ作って発信してみてください。
全員でpokerの解像度を上げていきましょう。
さて、今回noteを作成するにあたり、ヘッダー画像をTamicoさんという方に描いていただきました。
pokerもご存じの絵師さんでWpolar-gameの表紙として本当に素敵な絵を、私のイメージを加味して描いてくださいました。この場を借りてお礼と、ご紹介をさせて下さい。
以下Tamicoさんより頂いた紹介文となります。
フリーランスのイラストレーターで
商用イラストやキャラクターデザインなど多岐に渡り活動中です☺︎
個人さま向けのアイコンや一枚絵の制作も承っておりますのでTwitterや Instagramをぜひフォローしてご連絡ください💐
twitter:
instagram:
https://instagram.com/tami_san_desu?igshid=YmMyMTA2M2Y=
記事についてですが、投稿頻度が低くてすみません。
気が向いた時にゆるゆる書いています。多くの方が応援やお布施をしてくださっていることでモチベーションが維持できています。本当にありがとうございます。
誤字など見つけましたら筆者TwitterにDMいただけると幸いです。
本質的なミスの場合は購入者への通知とTwitter上での訂正をいたします。
練習問題についてですが、自分の頭でぜひ考えてみてください。
その過程が成長につながると思っています。
模範回答を作成してくれという要望が多ければ有料部分にでも加えようと思っています。簡単すぎて回答なんていらないよという方もお布施していただければ幸いです。
今回も全文無料です。
記事の値段はWpolarにしておきました。
ここから先は
¥ 1,010
Amazonギフトカード5,000円分が当たる
この記事が気に入ったらチップで応援してみませんか?