インディフェレンスの3つの法則
(翻訳元記事)
ポーカーにおける「インディフェレンス」は、最も誤解されている概念の一つです。
「インディフェレンス」とは、2つ以上のアクションが同じバリューを持つことを意味します。
従って、GTOポーカーにおいて、インディフェレンスが大きな役割を果たす理由を理解することは、ポーカー理論を学ぶ上で非常に重要となります。
GTOの解を解釈することは、科学というより芸術であることが多く、直感と科学的分析の組み合わせを必要とする主観的なプロセスであることが多いです。
GTOポーカーには経験則やヒューリスティックな法則は多いが、難しい法則はほとんどありません。
従って、事実と虚構を区別するためには、インディフェレンスに関する絶対的な厳密法則を学ぶことが不可欠となります。
この記事では、ナッシュ均衡を構成するインディフェレンスに関するいくつかの基本的な「厳密法則」について説明します。
これらの法則は、GTOにも、エクスプロイティブなスタイルを含む全てのポーカー戦略にも当てはまる法則です。
1.利己的なEVの法則
レンジの価値を高めるために、ハンドの価値を犠牲にすることはありません。
完璧な戦略とは、どの場面でも、それぞれの手札で最もEVの高いアクションを取ることです。
考えてみてください。
わざと負けるようなプレイをしますか?
常に最善の手を打たない選択をしますか?
レンジの期待値を上げるために、ハンドごとに-EVの手を打つということはありえないのです。
もしそのハンドが負けるようなコールなら、コールして損をする意味はないのです。
この法則1の帰結が法則2となります。
「利己的なEVの法則」は「インディフェレンスの法則」を意味します。
2.インディフェレンスの法則
ハンドに複数のアクションが混在している場合、それらのアクションは同じ値を持ちます。
例えば、コールとフォールドが混在するハンドの場合、コールの価値は0EVとなります。(フォールドするということはEV0ということなので、それとコールが同価値ということ。)
逆に、同じEVのアクションを持つハンドは、それらのアクションの間でインディフェレンスでなければいけません。
つまり、コールが$3、レイズが$3の価値がある場合、あなたはコールとレイズの間でインディフェレンスでなければなりません。
なぜEVの低いアクションを選ぶのでしょうか?
もしコールすることがフォールドすることよりも価値があるのなら、決してフォールドしてはいけません。
例を見てみましょう。
UTGがオープンし、BTNが3ベット。
UTGまでフォールドし、UTGはKQsだとします。
ここではGTO Wizardの「戦略+EV」ビューを選択しました。
KQが4ベットした場合とコールした場合のEVが0.31bbであることがわかります。
KQはどちらの行動も同じEVで取れるので、この2つのアクションの間ではインディフェレンスです。
他にも多くのインディフェレンスなアクションが見られます。
A5s (EV 0)はフォールド、コール、4ベットの間でインディフェレンスです。
QQ(EV3.38)はショッビン グ、4ベット、コールの間でインディフェレンスです。
88(EV0)はフォールド、コール、4ベットでインディフェレンスです。
純粋戦略を取る手札はほとんどありません。
戦略はこのように混合され、あらゆる対抗戦略に対してエクスプロイト不可能な状態となるのです。
この法則は、どのような戦略があるかに関係なく適用されます。
つまり、GTO戦略、エクスプロイト戦略、そしてその中間のあらゆる戦略に当てはまります。
対戦相手の不完全でエクスプロイティブな戦略を差し込むと、いくつかの手は必然的にインディフェレンスな決定に直面することになります。
エクスプロイティブなシミュレーションでは、相手の不完全な戦略に対して完全にインディフェレンスな決定が少なくなるため、純粋戦略が多くなる傾向があります。
インディフェレンスはGTOに依存せず、対戦相手の戦略にのみ依存します。
ソルバーが-EVのアクションを提案することもあります。
これはノイズの結果です。
十分に高い精度で解けば、そのノイズは消えます。
真の均衡では、意図的にEVの低いアクションを選択することはありません。
法則2の帰結は法則3です。
「インディフェレンスの法則」は「固定戦略の法則」を意味します。
3.固定戦略の法則
インディフェレンスなアクション同士のミキシングを変えても、固定戦略に対して価値を失うことはありません。
ミキシング・ミスによってエクスプロイトされるのは、相手が戦略をアジャストさせた場合のみです。
ミキシング・ミスとは何か?そして固定戦略とは何か?
ミキシング・ミスとは、インディフェレンスな決断の間でハンドを動かすこと。
固定戦略(GTOのような)は、相手に応じて変化したりアジャストしたりしない戦略のこと。
後のストリートでの私のレンジが変われば、私のEVも変わるのではないだろうか?
期待値はゼロサムである。
一方のプレイヤーが得をするためには、もう一方のプレイヤーが損をしなければならない。
では、同じEVを持つ2つの判断の間に間違ったものが混ざっている場合、一方のプレイヤーが戦略を変えずにどうやって得をするのだろうか?
手役のEVには、後のストリートの判定も含まれます。
このルールの大きな例外は、EVがゼロサムでない場合です。
レーキはあなたのEVに影響を与えるので、ミックス・ミスは両プレイヤーが支払うレーキの総額を増減させることができる。
こう考えてみよう。
あなたがしたことは、同じEVを持つ2つの行動の間でハンドを動かしただけです。
あなたは単に2つのインディフェレンスな決断の間でハンドを動かしただけです。
どちらの行動も相手の戦略に対して同じ価値を持っているため、ヴィランが戦略を変えない限り、相手は得をすることはできません。
例えば、KKは30%の確率でコールし、70%の確率でレイズすることでエクスプロイトが不可能になるとします。
それにもかかわらず、50%/50%のスプリットでアクションをしてしまったとします。
これはミキシングミスです。
ただ、どちらのアクションもEVは同じなのです(法則2)。
従って、相手が戦略を変えないのであれば、こちらがミキシング・ミスをしてコールとレイズのどちらを混ぜても同じペイオフになるということです。
しかし、だからといって好き勝手やっていいということにはなりません。
あなたの新しい戦略は悪用可能です。
相手がアジャストすれば、あなたのミキシング・ミスを罰することができるのです。
前の例に戻りましょう。
UTGがオープン、BTNが3ベット、UTGまでフォールドでKQs。
フォールドする頻度の高いハンドをすべてフォールドしたとしましょう。
あなたがしたことは、0EVのハンドを他のラインではなくフォールドラインに移動させただけです。
しかし、BTNはあなたのオーバーフォールディングを知ることで、3ベットレンジを広げることでエクスプロイトできます。
この場合、あなたは実際には+EVのハンドをフォールドし続けることになり、バリューを失うことになります。
BTNが利益を得るのは、彼らが戦略を変えたとき、あなたのミキシング・ミスに対してだけであることに注意しましょう。
この概念を理解するためには、一つの重要な点を理解する必要があります。
あなたの手札での最善の行動は、対戦相手の戦略によってのみ決定されるということです。
あなたのレンジ内のインディフェレンス領域は、相手がどうプレイするかの機能に過ぎないのです。
したがって、相手はあなたのレンジ内でどの手/アクションがインディフェレンスであるかを変えるために戦略を変える必要があります。
GTOは固定戦略です。
従って、ミスを混ぜた場合に対しては得をしません。
しかし、「純粋なミス」に対しては得をします。
決まった戦略に対して損をする行動はすべて「純粋なミス」です。
よくある誤解として、GTOは「どんなミス」に対しても利益を得るというものがありますが、 GTOは純粋なミスに対してのみ効果を発揮するのです。