見出し画像

[翻訳] エクスプロイト戦略構築の4ステップとHand2Note活用法 by Saulo Costa

今回は、Saulo CostaのYouTubeチャンネルより、Hand2Noteを利用したエクスプロイト戦略の構築方法を説明している動画を翻訳しました。

Saulo Costaは、ブラジル人のハイステークスオンラインプロであり、METAGAME (旧 BrPC) というステーキング会社の創業者で、MDAを活用したエクスプロイトプレイを得意としています。

最近YouTubeで積極的に情報発信をしているので、今後も面白い動画があれば、取り上げていきたいと思います。

Saulo Costa @sauloCostaPoker


プレイヤープールを破壊する方法

DESTROY Your Player Pool Using This Method

このビデオで紹介する勉強法のゴールは、期待値を最大化する戦略を構築することです。

もし相手が完璧にバランスの取れたGTOでプレイしていないとすれば、相手には必ずリークがあることを意味します。相手にリークがあるとすれば、私たちがやるべきことは、そのリークを特定して、それをエクスプロイトする戦略を構築することです。エクスプロイトすることで、GTO均衡プレイに留まるより多くの期待値を得ることができるのです。

リークを見つけるためには、GTOの行動と相手の行動を比較する必要があります。GTOに基づくエクスプロイト不可能なプレイと比較した時、相手の傾向が大きく乖離しているところをリークと呼ぶことができます。

この勉強法には4つのステップがあります。

  1. GTOデータを集める

  2. 人間のデータを集める

  3. 比較し、ギャップを見つける

  4. エクスプロイト戦略を構築する

Step 1. GTOのデータを集める

まずは、GTOのデータを集めることです。GTOのスタッツがなければ、プレイヤーと比較して、エクスプロイトできるポイントを見つけることができません。

GTOデータを集める方法はたくさんあります。以前はPioSolverなどのソフトウェアを使って、ゲームツリー全体をシミュレーションし、集合レポートを作成して、ソルバーがどのような頻度でプレイし、どのようなレンジ構成をするかを研究していました。
現在はサブスクリプションベースのサービス(GTO Wizardなど)があり、計算済みの情報が提供されています。

最近、私が好きなやり方はボットを使う方法です。私はGTOボットをプログラミングで開発し、ボット同士を戦わることによってハンドヒストリーを生成し、それをデータマイニングしています。

Step 2. 人間のデータを集める

2つ目はそのままですが、人間のプレイヤーによるプレイの履歴を集めることです。やり方は単純で、ただプレイすることです。プレイして生成されたハンドヒストリーをトラッカーに取り込むことで人々のプレイを研究することができます。

Step 3. 比較し、ギャップを見つける

3つ目は、GTOと比べて人間の相手プレイヤーのどこにギャップがあるかを見つけることです。そのギャップがエクスプロイト可能なポイントであり、そこに対して戦略を構築するのです。

このステップに関して、私はHand2Noteを利用することをおすすめします。Hand2Note (H2N) は、まさにこの用途のためのソフトウェアで、簡単に母集団 (population) の傾向を研究することができます。

Hand2Note

私は過去6年間このソフトウェアを利用してきていますが、非常におすすめできます。この動画はH2Nにスポンサーしてもらっていますが、そうでなくとも普段から私は人にH2Nを勧めています。これまでの私のキャリアにおける成功は、母集団に対するエクスプロイト能力があったからこそであり、それはH2Nのお陰です。

※H2Nの使い方については、この後より詳しい説明があります。

Step 4. エクスプロイト戦略を構築する

4点目は、Step 3で見つけたギャップに対して、利益的なエクスプロイト戦略を構築することです。

H2Nを使うことで、相手がどのようなレンジ構成でどのような頻度でプレイしていて、それらどのようにGTOから乖離しているか正確に知るためのデータを得ることができたので、その相手のプレイをソルバーでモデル化します。
私はPioSOLVERをずっと使ってきましたが、Pioにはノードロックという機能があります

PioSOLVER

想定される相手の戦略をPioSOLVERに入力し、それに対する最大エクスプロイト戦略 (Maximum Exploitative Strategy) がどのようになるかを再計算するのです。

この動画では、ステップ3についてさらに深掘りをします。ステップ4については、また別の動画を撮ることにしようと思います。

Hand2Noteの利用方法

ハンドヒストリーのインポート

まずハンドヒストリーをH2Nにインポートします。ここでは、GTOボットのハンドヒストリーと、人間のハンドヒストリーそれぞれを読み込みます。

私はGTOボットのプレイから、PokerStarsの形式でハンドヒストリーを生成しているので、それを取り込み、H2Nでスタッツを計算させます。

Hand history import

6つのボットで84,055ハンドプレイさせていて、それを一つのエイリアスに統合したので、GTOボットのハンドヒストリーは504,330ハンドあることになります。
人間のプレイのデータも同様に取り込みます。

ハンドヒストリーを取り込むとスタッツが計算されます。一度計算されたスタッツは何度も計算する必要がありません。
ハンドヒストリーを取り込んだ時にどのスタッツが計算されるのか知りたければ(あるいは変更したければ)、Configuration > Game Types を開いてください。

Configuration

この画面で、ハンドヒストリーを取り込んだ時に計算されるスタッツを変更できます。自分がプレイしているゲーム形式を選んで、デフォルトに選択されているポップアップ内のスタッツが計算されることになりますので、別のポップアップに変更すれば、そのスタッツが計算されます。

ポップアップ (Popup)

Popup Editorの画面では、自分で作りたいように、ポップアップを作ることができます。この機能は非常に柔軟かつパワフルで、自由にタブを増やしたり、見たいスタッツを選ぶことができます。

Popup Editor

レンジリサーチ (Range Research)

GTOボットと人間のプレイを比較するために、まずはプロファイルを構成します。そのためにはレンジリサーチを使います。レンジリサーチはH2Nがもつ高度な機能で、プレイヤーグループを作って、そのグループの傾向やスタッツをまとめて見ることができます。
恐らく皆さん、レギュラーとレクリエーショナルのグループに分けて分析をしたいと思います。もっと細かいグループに分けた分析もしたいと思いますが、少なくともまずはこの2つから始めましょう。

今回はRegの分析を行うため、Base Statsで "Is reg" を選択します。(ボットのデータが集計時に含まれないよう、ハンド数の上限を75,000に指定)
これでRegに分類されたプレイヤーのスタッツを統合する計算がされます。

Range Research

計算が完了すると、下のように事前に作成したポップアップに統合されたregのスタッツが表示されます。

Range Research

この人間のデータと比較するためにGTOボットのエイリアスをクリックして同じポップアップでスタッツを表示します。これで人間のプレイヤーがどれだけ、GTOと乖離しているか見ることができるのです。

上:GTOボット、下:Reg

ちなみに私が作ったGTOボットはGTO Wizardの500NL Simpleのプリフロップレンジを使用しています。
例えば、BB vs COの3Bet頻度を見てみましょう。GTOが9% 3betするところを、人間は約6,500ハンドで7%しか3betをしていません。BB vs BTNでも11%しか3betしていません。GTO Wizard等、あらゆるプリフロップチャートがオンラインで無料で見れる2023年現在でも、未だに人間はBBからの3betが過少であることがわかります。母集団は3bet頻度に多くのリークを抱えているのです。
同じように4betにもリークがあります。例えば、GTOはHJでブラインドに対して11% 4betしますが、人間は8%しか4betしていません。

これらの情報を基に、リークに対するカウンター戦略を考えることができます。一番よいやり方はこのレンジをプリフロップソルバーに入れて計算することですが、直感に基づいてアジャストすることもできます。
例えば、3betがやや少ないとわかっていれば、それはGTOよりもレンジが強い可能性が高いので、相手の3betに対して少しoverfoldするのです。

また、下の画面のように3betレンジを表示し、これをプリフロップソルバーにコピーして計算することで、このレンジのプレイヤーに対するMESを計算できます。
恐らくオープンレンジを少し広げることができ、また3betには少し多くフォールドすることになるでしょう。

Range Research

これでプリフロップのリークを見つけることができました。他にリークがないか、次にOOP コーラーの例を見てみましょう。

左:Reg、右:GTOボット

フロップでベットされた時、人間もかなりGTOボットに近いプレイができているようです。人間のXF頻度は33%、GTOボットは32%です。ここ2~3年でミドルステークスのRegがかなり上達したスポットです。

次にX-XFの頻度を見てみましょう。フロップはチェックで回って、ターンもprobeを打たずにチェックし、相手からDelayed CBetを打たれた時のフォールド頻度です。人間は60%フォールドしていますが、GTOボットは49%しかフォールドしません。つまり人間はDelayed CBetに対してオーバーフォールドしていることがわかります。

私のPlay & Explainedの動画でも話したことがありますが、あらゆるレイトCbetのノードは、人々がリークを持っているメジャーなスポットです。その理由は、X-B (probe) 頻度を見るとわかります。GTOボットは32%しかprobeを打たないですが、人間は41%もprobeを打っています。つまり、バリューハンドをファストプレイしすぎているために、チェックレンジが少し弱くなってしまい、Delayed CBetに多くフォールドすることになるのです。

以上が、相手プレイヤーのプレイからリークを見つける方法です。この方法をゲームツリーのすべてのスポットで行い、リークを見つけたらそれを記録していきましょう。この情報があれば、Step 4に進むことができます。

翻訳元:https://www.youtube.com/watch?v=qN7rSWXcZ8s
※記事の翻訳は一部抜粋、要約しています。


翻訳は以上です。読んで頂いてありがとうございました!

皆様からのリアクションがこの翻訳noteのモチベーションになっています。ぜひスキ・フォロー・拡散・投げ銭で応援して頂けると嬉しいです!


Hand2Noteを利用してみようと思った方はTwitterを徘徊すると、お得な割引コードや詳細な解説動画が見つかるかも知れません… 

https://twitter.com/whskycat
https://twitter.com/JP_pokeraccount/status/1651815947790086144

※以下の有料部分には何も書かれておりません。

ここから先は

14字 / 1画像

¥ 300

スキ・拡散・サポートで応援して頂けるととても助かります。サポートは100円でもいいです。先に言っておきますが、ありがとうございます。