見出し画像

CBの傾向とパターン集 (IP2bet)

Turn以降のGTOを再現することの難しさ

FlopのGTOを再現する方法の1つとしてボードの特徴を使ったパターン暗記をする方法があり、筆者もその方法を使用しています
(例.Kペアボードは33%レンジbetする)

しかし、ボードの数が膨大になるTurn以降のノードではこの方法は使用できないので、GTOを再現するには別の方法を考える必要があります

この記事はTurn以降のノードにおいてもGTOを再現するプロセスとそれを実現する方法について研究した内容をまとめたものです


分析の目的

ボードの特徴を使ったパターン暗記に代わる、GTOを簡易的に再現するための手段として、役分布を使った戦略構築プロセスを考えました

そして、このプロセスを実現するために下記の3つの分析を行いました

分析の概要

分析1 bet頻度予測ヒューリスティックの構築


実例1

実例1は役分布が予測モデルに与える影響を可視化したもので、最上段の右から4番目のグラフを見るとOOPレンジの3カードの比率と150%betの間に負の
相関があることが分かります


分析2 役分布とbet頻度のパターン化


実例2

実例2は役分布とbet頻度のパターン(以降、戦略パターンと呼びます)を可視化したもので、各クラスターのbet頻度の平均と役分布の平均が分かるようになっています


分析3 戦略パターンから代表例を抽出する


実例3

実例3は抽出された代表例のボードを可視化したものです(見方は後述します)


分析1〜3の詳細については付録1に記載しているので、詳細が気になる場合はそちらを参照してください


分析の対象


IPのオープンにBBがコールしたポットでのCBを分析するために、BTNvsBBとUTGvsBBの集合分析を1つにまとめたものを分析対象のデータとしています
(役判定の都合によりボード上で2ペア以上の役が成立してるボードはは例外としてデータから取り除いています)


グラフの見方


戦略パターングラフの見方

右側の棒グラフはOOPとIPの役分布を表しています、色の意味は左下の凡例を参照してください
左側の棒グラフはレンジ全体のbet頻度を表しており、色の意味は右下の凡例を参照してください(mixとpureの定義は後述します)


代表例グラフの見方

タイトルの見方
タイトルはプリフロの状況とそれまでのラインを示しています
この例の「33%_c」はフロップで33%のbetとそれに対するコールがされたことを表しています

左上のグラフの見方
左上の棒グラフは10段階のEQ bucketを表しています、右にいくほどEQが高く、紫部分はEQ90-100のハンド割合、赤部分はEQ0-10のハンド割合を表しています

左下のグラフの見方
左下は役分布のチャートで縦軸は役の強さ、横軸はレンジに占める割合を表しています、赤色の補助線は各ベットサイズのMDFでベット後の残レンジを把握する目安として記載しています

右側のグラフの見方
右側の棒グラフは全体と役毎のベット頻度です各アクションは純粋と混合に分割されていて基準は以下の通りです

  • 頻度が99%以上のアクションがあれば、そのハンドはそのアクションの純粋戦略ハンドとしてカウントされる

  • 頻度が99%以上のアクションがなければ、そのハンドは頻度に応じて各アクションの混合ハンドとして分割してカウントされる

例.150%betを70%、66%betを30%頻度で行うハンドが1コンボ存在する場合、mix150%0.7コンボ、mix66%0.3コンボに分割してカウントされる

補足事項


ボードの分類
役がもつEQを均一に近づける為に、ボードを以下の基準で分割し、それぞれに対して個別に分析を行なっています

  1. Dryボード
    ボードに同じ3枚以上のスートとペアが存在しない、かつ双方のレンジにストレートが存在しない

  2. Straightボード
    ボードに同じ3枚以上のスートとペアが存在しない、かつ少なくともどちらかのレンジにストレートが存在する

  3. Flushボード
    ボードに同じスートが3枚以上存在する、かつペアは存在しない

  4. Pairボード
    ボードに同じスートが3枚以上存在しない、かつペアが存在する

  5. Pair&Flushボード
    ボードに同じスートが3枚以存在する、かつペアが存在する


役の判定基準

  1. ストフラの判定をしていないので、ストフラはフラッシュの中に埋もれています

  2. ボードの最大の数値より大きい1ペアをOPとしています

  3. キッカーがQ以上のトップペアをTP(GK)、それ以外をTP(LK)としています

  4. ペアの数値をPnとして次の条件を満たす1ペアをMPとしています
    ボード最大の数値 > Pn => ボードで2番目の数値

  5. 2〜4の条件に当てはまらない1ペアをLPとしています

  6. ペアボードにおける2ペアは2〜4の条件を使って1ペアとして判定しています

  7. フラッシュドローは1ペア以上の役を持たないハンドだけがカウントされています(1つのハンドに1つの役を対応させるため)


Flop CBの傾向とパターン

下記のノードにおける分析1-3の結果です

  • BTNvsBB 2bet Flop

  • UTGvsBB 2bet Flop


Dryボード

レンジ全体bet頻度の傾向

66%bet頻度と正の相関がある役
OOP: TP(LK), LP
IP: 3C, 2P

66%bet頻度と負の相関がある役
OOP: 3C, 2P, 役なし
IP: TP(LK), MP

33%bet頻度と正の相関がある役
OOP: Aハイ, 役なし
IP: 3C, TP(GK), MP

TwotoneボードはRainbowボードより33%bet頻度が下がる

戦略パターン

戦略パターンの代表例


Straightボード

レンジ全体bet頻度の傾向
66%bet頻度と正の相関がある役
OOP: TP(GK), MP
IP: ストレート, LP

66%bet頻度と負の相関がある役
OOP:ストレート、3C
IP: Aハイ

33%bet頻度と正の相関がある役
OOP:ストレート, 2P, LP
IP: 3C, TP(GK)

A-TもしくはK-9のストレートが完成するボードだと66%と33%どちらのbet頻度も上昇する

戦略パターン

戦略パターンの代表例


Flushボード

レンジ全体bet頻度の傾向
33%bet頻度と正の相関がある役
OOP: TP(GK), LP
IP: 3C

33%bet頻度と負の相関がある役
OOP: フラッシュ、2P
IP: MP

Aハイボードはチェック頻度が高くなる

戦略パターン

戦略パターンの代表例


Pairボード

レンジ全体bet頻度の傾向
66%bet頻度と負の相関がある役
OOP: 3C

33%bet頻度と正の相関がある役
OOP: Aハイ
IP: 3C

33%bet頻度と負の相関がある役
OOP: OP

TwotoneボードはRainbowボードより33%bet頻度が低くなる

戦略パターン

戦略パターンの代表例



Turn CBの傾向とパターン

下記のノードにおける分析1-3の結果です

  • BTNvsBB 2bet 33%CB → Call

  • BTNvsBB 2bet 66%CB → Call

  • UTGvsBB 2bet 33%CB → Call

  • UTGvsBB 2bet 66%CB → Call

Dryボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
OOP: TP(GK), TP(LK)
IP: 3C, 2P

150bet頻度と負の相関がある役
OOP: 3C, 2P, LP
IP: TP(LK), フラッシュドロー

66%bet頻度と正の相関がある役
OOP: LP、Aハイ
IP: フラッシュドロー

66%bet頻度と負の相関がある役
OOP: TP(GK), TP(LK)

33%bet頻度と正の相関がある役
OOP: LP
IP: MP

戦略パターン

戦略パターンの代表例


Straightボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
OOP: TP(GK), TP(LK)
IP: ストレート

150%bet頻度と負の相関がある役
OOP:ストレート, LP, Aハイ
IP: TP(GK),TP(LK)

66%bet頻度と正の相関がある役
OOP:LP, Aハイ
IP: OP, TP(GK)

66%bet頻度と負の相関がある役
OOP:ストレート, 2P , TP(GK), TP(LK)

33%bet頻度と正の相関がある役
OOP: ストレート, LP
IP: ストレート, TP(LK)

33%bet頻度と負の相関がある役
OOP: TP(GK), TP(LK)

戦略パターン


戦略パターンの代表例


Flushボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
OOP: ストレート
IP: フラッシュ

66%bet頻度と正の相関がある役
OOP: TP(LK)
IP: OP

66%bet頻度と負の相関がある役
OOP: フラッシュ、2P

33%bet頻度と正の相関がある役
OOP: LP
IP: 3C以上の役全て

33%bet頻度と負の相関がある役
OOP: TP(LK)

戦略パターン


戦略パターンの代表例



Pairボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
OOP: OP, TP
IP: フルハウス

150%bet頻度と負の相関がある役
OOP: フルハウス, 3C

66%bet頻度と正の相関がある役
OOP: LP
IP: 3C

66%bet頻度と負の相関がある役
OOP: 3C, TP(LK)
IP: LP

33%bet頻度と正の相関がある役
OOP: LP
IP: 3C、TP(LK)

33%頻度と負の相関がある役
OOP: TP(LK)

戦略パターン


戦略パターンの代表例



Pair&Flushボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
OOP: 3C, TP(LK)
IP:  フルハウス

150%bet頻度と負の相関がある役
OOP: フルハウス, LP
IP: 3C

66%bet頻度と正の相関がある役
OOP: MP, LP
IP: フラッシュ

66%bet頻度と負の相関がある役
OOP: フラッシュ
IP: MP, LP

33%bet頻度と正の相関がある役
OOP: LP
IP: 3C

33%bet頻度と負の相関がある役
OOP: TP(LK)

戦略パターン


戦略パターンの代表例


River CBの傾向とパターン

下記のノードにおける分析1-3の結果です
BTNvsBB 2bet 33%CB→Call→66%CB→Call

Dryボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
OOP: TP(LK)
IP: 3C, 2P

150%bet頻度と負の相関がある役
OOP: 3C, 2P
IP: TP(GK), TP(LK)

66%bet頻度と正の相関がある役
OOP: 3C
IP: TP(GK)

66%bet頻度と負の相関がある役
OOP: TP(LK)

戦略パターン


戦略パターンの代表例



Straightボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
OOP: 3C, TP(LK)
IP: ストレート

150%bet頻度と負の相関がある役
OOP: ストレート
IP: TP(GK)

66%bet頻度と正の相関がある役
OOP: MP, LP
IP: IP(GK)

戦略パターン


戦略パターンの代表例


Flushボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
IP: フラッシュ

150%bet頻度と負の相関がある役
OOP: フラッシュ
IP: 2P

66%bet頻度と正の相関がある役
OOP: TP(LK)
IP: ストレート、3C、2P

66%bet頻度と負の相関がある役
OOP: 2P以上の役全て

戦略パターン


戦略パターンの代表例


Pairボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
OOP: TP(LK)
IP: フルハウス

150%bet頻度と負の相関がある役
OOP: 3C以上の役全て
IP: OP, TP(GK)

66%bet頻度と正の相関がある役
OOP: フルハウス
IP: 3カード、OP、TP(GK)

66%bet頻度と正の相関がある役
OOP: ストレート、3C

戦略パターン

戦略パターンの代表例



Pair&Flushボード

レンジ全体bet頻度の傾向
150%bet頻度と正の相関がある役
IP: フルハウス

150%bet頻度と負の相関がある役
OOP:フルハウス

66%bet頻度と正の相関がある役
OOP: LP
IP: フラッシュ

66%bet頻度と負の相関がある役
OOP: フラッシュ、ストレート、3C

戦略パターン


戦略パターンの代表例



付録1 分析方法の詳細

piosolverの設定

プリフロップ
UTGvsBB2bet,BTNvsBB2bet
どちらもWizardレンジ50nl,2.5opne,simple

ベットサイズ
(
計算時間短縮のために分析するストリートによって設定を分けています)
Flop分析用
Flop:33%,66% Turn:66%,150% River:66%,150% Raise:50%
Turn,River分析用
Flop:33%,66% Turn:33%,66%,150% River:33%,66%,150% Raise:50%

Subset
Flop:1755*2
Turn:184*2
River:50(BTNvsBBのみ)

lake
0%(設定忘れ)

精度
Flop分析用
0.3%
Turn,River分析用
0.1%


分析1の詳細

以前の記事と同じく、lightGBMで予測モデルを作成し、SHAPで予測の傾向を確認する方法を取っています

予測モデルの説明変数
OOP,IP双方の役分布(合計28変数)
(それぞれストリート開始時の値を使っています)

予測モデルの目的変数
各アクションの頻度
(アクション毎に個別に予測モデルを構築しています)


役分布を採用した理由
役分布はEQ分布と比較して次の点で劣ります

  • 同じ役でも相手のレンジ次第でEQが異なる

  • ドロー分EQが全く考慮されない

しかし、実践においてEQの判定は困難ですが、役の判定はそれよりも容易です、なので今回の分析では実践での使いやすさを優先してEQ分布ではなく役分布を分析のベースとして採用しています

予測モデルの精度
元データを8:2で学習データとテストデータに分け、テストデータに対する決定係数(R2)と誤差平均(MAE)を計測した結果は次の通りです

TurnCBのPair&Flushのスコアが比較的悪く、役分布だけでは捉えきれない要素が存在すると思われますが、今回の分析では特定できていません

SHAP分析の結果は付録2に記載しています


分析2の詳細

KMeansを用いたクラスタリングを行いました
距離空間などの設定はsklearnのデフォルトを使用しています

特徴量
分析1で得られたbetsize毎のシャープレイ値をそのボードの特徴量として使用しています

例. Flop分析の場合
66%bet頻度に対するOOP,IP双方の役分布の28次元のシャープレイ値
33%bet頻度に対するOOP,IP双方の役分布の28次元のシャープレイ値
合計56次元のシャープレイ値をPCAで10次元に圧縮して特徴量として使用しています

特徴量選定の理由
役分布と戦略分布が最初の候補でしたがそれぞれ問題がありました

役分布の問題
戦略に与える影響が大きい役とそうでない役を同列に扱ってしまうので、クラスター内戦略のばらつきが大きい

戦略分布の問題
役分布を考慮しないので、戦略が似ているが役分布が大きく異なるボード同士が同じクラスターに分類されてしまう

役分布のシャープレイ値ならば、戦略と戦略に与える影響が大きい役の分布の両方を考慮したクラスタリングになると考え、これを採用しました

クラスター数の設定
一律で10に設定しています、理由はそれ以上だと筆者が扱いきれないからです


分析3の詳細

各アクションのクラスター平均値との差の絶対値の合計が最も小さいボードを代表例として抽出しています


付録2 SHAPグラフ

分析1の予測モデルに対してSHAP分析を行なった結果のPDグラフです

Flop CB

Turn CB


River CB


この記事が気に入ったらサポートをしてみませんか?