見出し画像

【翻訳】プログレッシブノックアウトトーナメントのセオリー【PKO】GTOWブログ.39


ポーカーでは、PKO(プログレッシブノックアウト)トーナメントは、バイインの一部が各プレイヤーの『懸賞金』に充てられるタイプのトーナメントである。

PKOトーナメントでは、プレイヤーが他のプレイヤーを脱落させると、脱落したプレイヤーの懸賞金の半分が賞金として支払われる。残りの半分の懸賞金は自分の『首』に加算され、他のプレーヤーが獲得しようとする。スプリットポットで2人以上のプレイヤーが勝った場合、懸賞金は勝者全員に均等に分配される。ポーカースターズのようなPKOトーナメントを開催しているサイトでは、⅔または賞金プール全額を懸賞金に充てている場合もある。この記事では、標準的な賞金総額50%のバウンティトーナメントのみを取り上げる。

懸賞金の効果は、戦略のレイヤーを増やす!PKOトーナメントでは、ただトーナメントを勝ち進むのではなく、対戦相手を倒して賞金を獲得しようというインセンティブが働くため、アクションが多くなる傾向がある。また、このフォーマットでは、チップアドバンテージのあるプレイヤーは、プレイ中のチップ以外のEVを稼ぐことができるため、ショートスタックに対してアグレッシブにプレイすることが出来る。



ICM vs ChipEV

一般的に言われていることとして、チップEVはPKOトーナメントにおけるスタックの価値の指標としては不十分である。伝統的なチップEVの計算は、トーナメントであなたがコントロールしているチップの割合に依存しています。スタックの価値は次のようにモデル化出来る:
スタックのチップEV=チップポーション(懸賞金プールの残り+賞金プールの残り)
ここで「チップポーション」とは、あなたのスタックがトーナメントにおいて持っているチップの割合である。この単純化された計算では、全体のチップ量の10%を持っていれば、トーナメントに残っている賞金の10%を獲得できるはずだと仮定している。しかし、以前に示したように、これは欠陥のある仮定である。ICMは、トーナメントの初期段階であっても、あなたの成績に大きな影響を与える。

ICMはトーナメント、特にPKOトーナメントでスタックの価値を決定する、より正確な方法である。ICMの計算では、プレイヤーが1位、2位、3位などの異なる順位に入る頻度を考慮し、それに応じてチップの価値を調整する。さらに、ソルバーの計算では、ICM、ポジション、賞金構成、懸賞金配分、各プレイヤーの戦略、カバーされているプレイヤー、ポストフロップEQR、その他多くの要素を組み込み、PKOトーナメントにおけるスタックの真の価値を測る。
このため、GTOWのPKOシミュレーションでは、トーナメントのすべての局面でICM計算を使用している。私たちのシミュレーションは、上記の要素を含むスタックの真の価値を示している。

バウンティパワー

多くのプレイヤーはバウンティを、スタックの少ない相手に勝った時の賞金という観点だけで捉えがちである。しかし、これは正しい見方では無い。自分がカバーするプレイヤーに対してスタックを全て投下する場合、自分がコントロールするチップの価値に対する相手のバウンティの価値を考慮する必要がある。賞金とチップの換算係数は「バウンティパワー」と呼ばれる。PKOの専門家は、この係数を使って1ドルの賞金をチップの価値に換算する。

バウンティパワーは$1のバウンティの価値をビッグブラインドに換算する。

ウィザードに表示されているバウンティのサイズにバウンティパワー係数を掛けると、そのバウンティのビッグブラインドでのおおよその価値がわかる。これをポットオッズ計算のリワード側に加え、スタックオフの閾値を決定する。

バウンティパワー = プレイ中のチップの総量 / (残りのバウンティプール + 残りの賞金プール)

  • プレイ中のチップ総量は、平均スタックに残りプレイヤー数を掛けることで求めることが出来る。

  • 賞金プールの残りは、スタート賞金プールから既に支払われた賞金を引くことで求められ、これはバブルの後に行われる。

  • 残りの懸賞金プールはシミュレーションで求めた。しかし、以下の式で概算することができる:開始懸賞金プール - ($50 x 排除されたプレイヤー数)

これはチップEVの計算に基づいているため、ICMの要素が大きくなるにつれてバウンティパワーは正確でなくなる傾向があることを認識することが重要である。

200人規模のPKO(8Max)

自分で計算するよりも、この表を参照することで、トーナメントのステージごとのバウンティパワーを確認することが出来る。以下は、200人のPKO 8maxソリューションのバウンティ・パワー係数である:

懸賞金の価値は、トーナメントが進みチップの価値が高くなるにつれて、ビッグブラインドの価値に対して減少することに注意してほ欲しい。PKOの後半になると平均バウンティが増える傾向があるにもかかわらず、である。
バウンティパワーをどのようにポットオッズ計算に適用するか見ていこう。
PKOをプレイしていて、フィールドの70%が残っているとする。このスポットを選んだのは、トーナメント序盤ではチップEVでの計算がより正確だからである。平均スタックは50BB。ヒーローはビッグブラインドに69BBのスタックで座っている。

この状況のUTGの13BBのAIレンジは以下である

UTGをカバーしているBBまでフォールドでアクションが回ってくる。このAIに対するポットオッズを計算することから始めよう。標準的なポットオッズの公式は単純である:

コールするのに必要なエクイティ = コールする額 / コール後のポット
コールする金額 = 12BB
コール後のポット = 13 + 13 + 1.5 = 27.5BB

したがって、ポットオッズは12/27.5 = 43.6%となる。つまり、バウンティがなければ、少なくともこれだけのエクイティがあるハンドはコールすることになる。

PKOでは、この式の分母にバウンティの価値を加える必要がある:

コールするのに必要なエクイティ=コールする金額/(コール後のポット+(バウンティ×バウンティパワー)
獲得可能なバウンティ = $50
バウンティパワー = 7,018 / ($16,836 +$20,000) = 0.191

UTGの50ドルの賞金は50 * 0.191 = 9.55BBに換算される。これを賞金に加えよう:
コールに必要なエクイティ = 12 / (27.5 + 9.55) = 32.4%
つまり、BBはUTGのAIレンジに対して少なくともこれだけのエクイティがあればどんなハンドでもコールできる。あなたのレンジのエクイティは以下のようになる:

43%以上のエクイティを持つハンドは濃い緑で、32.4%以上のエクイティを持つハンドは薄い緑で表示されている。バウンティが絡むと、スタックオフのしきい値がどれだけ広くなるか見てみよう!
この計算機ではデッキがトップヘビーに偏るバンチング効果を考慮していないため、これらのエクイティは正確では無い。しかし、我々の目的には十分近い。

以下の図がICM、バウンティ、バンチングを考慮したBBのGTO戦略だ:

少なくともエクイティが33%以上のハンドはコールする。A4o、A7o、Q7♠、54♠のような手はフォールドとコールのちょうど境界線上にある。

PKOにおけるバブルファクター

PKOのソリューションの読み方をよりよく理解するために、GTOウィザードの以下のスポットを検証してみよう:

フィールドの50%(100人)が残っている
平均スタックは60BB
スタックとバウンティは以下の通り:

まず、バブル・ファクターを検証することから始めよう。バブルファクターは、MTTにおいてチップを増やすことよりも減らすことがどの程度『悪いことなのか』を測るものだ。これは生存プレッシャーの指標であり、ICMスポットを理解するための貴重なツールである。以下はこのシナリオのバブルファクターである:

PKOではしばしば興味深いことが起こる。バブルファクターが1未満になる可能性があるのだ!これはマイナスのリスクプレミアムに相当する。チップEVの計算では、バブル・ファクター(BF)は常に1に等しい。

  • プラスのリスクプレミアムは、損失が利益よりも価値が上回ることを示す。

  • マイナスのリスクプレミアムは、損失よりも勝利の方が価値が高いことを示す。

言い換えれば、PKOでは、ChipEVよりもワイドにプレーするインセンティブがあるスポットもある!PKOにおけるICMソリューションのリスクプレミアムは、同等のスポットにおけるクラシック(通常のペイアウトのトーナメント)ソリューションよりも一般的に低い。
では、これが戦略にどのような影響を与えるのだろうか?アクションがBTNまでフォールドで回ったとしよう。BTNは36BBを持っていて、$50のバウンティがかかっている。彼らは以下のレンジで2.1BBにオープンする:

ここでのEV(Expected Value)はドルではなく、テーブルのエクイティに対する変化率であることに注意。AAの値は2.63であり、BTNはこのハンドをオープンしたとき、テーブル全体のEVのうち自分の分が2.63%増加すると予想していることになる。
SBのアクション。SBはこのテーブルで最大のスタック(92BB)を持っており、BTNとBBの両方をカバーしている。このため、彼らは幅広いハンドで非常にアグレッシブにプレイする。SBはより多くのバウンティを獲得しようと多くのハンドをAIしている。

SBのアグレッシブな戦略は、彼らがこのテーブルのチップリーダーであり、残りのプレイヤーをカバーするためにスタックの3分の1程度のリスクしかないためだと考えられる。さらに、BTNとBBはICMのプレッシャーからも慎重にプレイする必要がある。
これはバブルファクターに反映されている。SBはBTNに対して負のリスクプレミアム(-4.6%)を、BBに対しても負のリスクプレミアム(-6.2%)を持っている。このことは、SBが残りの両プレイヤーに対してポットをプレイするインセンティブが高いことを意味する!

逆に、BTNとBBはともにプラスのリスクプレミアムを抱えており、勝利よりも損失を避けるインセンティブが大きいため、SBや互いに対してより慎重にプレーする必要があることを示している。

まとめ

  • ノックアウトトーナメントにおけるスタックの価値は、あなたがコントロールするチップの割合を、残りの賞金総額(バウンティ+通常の賞金)で割ったものにほぼ等しくなる。

  • 残りの賞金総額に対するプレイ中のチップ総額の比率は、賞金の相対的な価値をチップやビッグブラインドに換算するのに使える。

  • PKOの専門家は、バウンティ係数を用いてバウンティをチップに換算し、それをポットオッズの計算に入れて、有効なスタックオフの閾値を概算する。

  • ノックアウトトーナメントでは、時にマイナスのリスクプレミアムが発生する。バウンティが十分に大きく、相手をカバーしている場合、勝つことで得られる利益が、そのプレイヤーに対してスタックを失うことによる損失を上回ることがある。これは、プラスのリスクプレミアムを特徴とするほとんどのトーナメント形式とは対照的である。

・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

記事は以上になります。最後まで読んでいただきありがとうございました。
この記事を読んで良いと感じて頂けましたら、noteのスキ、やSNSでの拡散、Twitterのフォローやサポートをして下さりますと本当に執筆の励みになります!

この記事が気に入ったらサポートをしてみませんか?