【翻訳】MTTでICMが重要になるタイミングはいつなのか？【ICM、MTT】GTOWブログ.33

2024年1月31日 17:29

インディペンデント・チップ・モデル(ICM)は1987年にM.Malmuthによって考案され、トーナメントポーカーの戦略を理解する上で最も重要な公式の一つである！しかし、その概念を完全に活用するまでに35年近くかかった...。

ICMはトーナメントのスタックを評価するのに優れているが、最近まで、多くのプレイヤーが残っている大きなフィールドのMTTで計算するのは不可能に近かった。そのため、多くのプレイヤーが残っているトーナメントでは、誰もがチップEVモデルを使ってトーナメントを評価してきた。最近のポーカー科学の進歩により、数百人、数千人のプレイヤーが残っていてもICMを計算できるようになった。
しかし、ここで一つの重要な疑問が浮かぶ。トーナメントでICMが重要になるのはどの時点なのだろうか？いつチップEVからICMソリューションに切り替える価値があるのだろうか？私たちは Holdem Resources Calculator の創設者である Helmuth と共同で一連の実験を行い、それを明らかにした。

ICMとは何か

インディペンデント・チップ・モデル(ICM)は、あなたのトーナメントスタックをチップからドルに変換する公式である。ICMは、スタックサイズ単体を用いて、プレイヤーが各順位（1位、2位など）でフィニッシュする確率を決定し、その順位のペイアウトに基づいてトーナメントエクイティを割り当てる。トーナメントエクイティとは、ペイアウトストラクチャー、イベントにおける順位、そしてスタックサイズを考慮した上で、賞金プールの分配を予想したものである。
ICMの計算方法について詳しく知りたい方は、この記事を読んでほしい。より視覚的で直感的なアプローチでICMを理解したい場合は、このビデオを見ること。

ICM vs ChipEV

チップEV＝チップを最大化する戦略

ICM＝獲得賞金を最大化する戦略

この2つは同じではない。ICMの基本的なトレードオフは、より多くの賞金を獲得するためにチップを犠牲にすることがあるということである。これは「リスクプレミアム」と呼ばれる概念のためである。MTTでは、より長く生き残るために、マージナルなスポットを避ける価値があることもある。損失は、同等のチップの利益よりも大きな痛手となる。逆に、チップリーダーは、他のスタックのプレイヤーがより慎重にプレイすることを期待し、より積極的にプレイすることがある。このようなリスク回避のダイナミズムは、ChipEV戦略には存在しない。ChipEV戦略は、飛ぶ事を恐れずにチップを最大化するだけである。

では、このトレードオフは有効なのだろうか？ドルのためにチップを犠牲にすべきなのだろうか？

もっと掘り下げていこう。

方法論

以下の実験の目的は、どの時点でICMがMTTにおいて重要な要因となるかを突き止めることである。どの時点でChipEVモデルからICMモデルに切り替えるべきか？それを知るために一連の実験を行った。異なる戦略プロファイルを持つトーナメントをいくつかシミュレートし、互いに競争させた。

比較サンプル一覧

ICM 100% (純粋なICM)
cEV 25% -> ICM 75%
cEV 50% -> ICM 50%
cEV 62.5% -> ICM 37.5%
cEV 75% -> ICM 25%
cEV 95.5% -> ICM-FT (ファイナルテーブルのみICMモデル)

例えば、このサンプル：(cEV 25% -> ICM 75%)は25%のプレイヤーが脱落するまでチップEV戦略を使う。その後、MTTの残り人数75%でICM戦略に切り替える。各トーナメントには、各戦略プロフィールの等しいサンプルが含まれる。それぞれの結果を集計し、どの時点でICMに切り替えることが結果に大きな影響を与えるかを見る。

実験#1 - 200人のフリーズアウトトーナメント

《設定》

200人MTTフリーズアウト
フィールドの15%がITM
プッシュ/フォールド
BB = 平均スタックの1/7
6種類の戦略を比較する
全てのプレイヤーがお互いの戦略を知り、それに戦略を調整する
サンプルサイズ: 500,000トーナメント

200人規模のフリーズアウトを実施。これはプッシュ/フォールドトーナメントで、BBはトーナメント平均スタックの1/7に正規化される（平均スタック=7BB）。これはプレイヤーが脱落する度に更新される。プッシュ/フォールドのイベントなので、プリフロップの戦略だけをシミュレートする。すべてのプレイヤーはお互いの戦略を知っており、それにアジャストする。

《結果》

以下のグラフは、各ストラテジープロファイルの平均投資収益率(ROI)を示している。見ての通り、ICMに早く切り替えたプレーヤーの方がROIが高い。

フィールドの残り50%から37.5%の間で、わずかなROIの減少が見られる。この時点で損失は統計的有意性を超えており、この損失は分散の結果ではないことを示している。
この結果は、ICMがバブルのかなり前から重要な要因になることを示しており、我々を驚かせた。フィールドの15%に賞金は支払われるので、バブルは残りプレイヤーの15%で発生する。しかし、(cEV 75%/ICM 25%)は、バブルのかなり前にICMに切り替えたにもかかわらず、大きな価値を失っていることがわかる。
最下位では(cEV 95.5%/ICM 4.5%)が平均してバイインの13%を失っている。このサンプルはチップEVモデルを使い、ファイナルテーブルでのみICMに切り替える。

《プレイスメント》

これらのエッジはいったいどこから来ているのかを探ってみよう。次のグラフは、各ストラテジー・サンプルの累積ITMペイアウトを表示したものである：

より早くICMに切り替えたストラテジーは、より頻繁にITMしていることがわかる。これがICMが全体としてより多くの資金を獲得している主な理由である。
これをさらに分解することができる。次のチャートは、各戦略が各プレイスメントを到達する頻度を示している：

右側の(cEV95.5%/ICM4.5%)はバストの頻度が高く、入賞の頻度が低いことがわかる。この戦略サンプルはファイナルテーブルまでチップEVを使っていることを思い出してほしい。
にもかかわらず、cEV戦略は他の戦略よりも1位になることが多い。これは実際、我々の予想通りの結果である！ICM（および他のMTTエクイティモデル）は、1位になる確率はトーナメントにおけるチップの割合に等しいと予測している。そのため、チップを最大化する戦略は、ITMへのプレイスメントへの到達確率を犠牲にしてでも、より頻繁に1位を獲得することになる。

《ベースラインとなるプレイスメントとの比率の変化》

上記のプレイスメントを "ベースライン "となる確率と比較することができる。次の図は、ベースラインのプレイスメント確率に対する比率の変化を示している。

ベースラインの確率 = ランダムに戦略を選ばれた場合のプレイメント確率。
比率の変化 = 実際のプレイメント確率 / ベースラインのプレースメント確率 - 1

言い換えると、(cEV 95.5% / ICM 4.5%)の戦略は、ランダムな他の戦略と比較して、１位にになる確率が18%高いが、バストする確率も5.2%高い。

《期待値》

ここで最も重要なのは、期待値の問題である。100ドルのバイインを使用し、各プレイスメント頻度にその賞金の期待値を掛け合わせ、その戦略がプレイスメントのどこで価値を得ているか、あるいは失っているかを見ることにする。このトーナメントの賞金プールは$20,000となる。

EV = プライズ% × 賞金プール × プレイスメント到達頻度 - $100(バイイン)

トーナメント内の各プレイスメントからどれだけの賞金がもたらされるかを見るのは興味深い。
この表はベースラインEVの変化として解釈しやすい。ICM100%からICM37.5%の戦略は、2位と1位を除く全てのプレイスメントでEVを得ている。これは、基本的なICMトレードオフの威力を示している-MTTでは生存する事が王である。一方、ICM 25%戦略以降は、バブル近辺のプレイスメントでのEVを犠牲にする代わりに、上位プレイスメントでのEVを高めている。

最後に、戦略別のプレイスメントの期待値をグラフにする。
このグラフの線は非常に近しいが、1つだけ大きな外れ値（cEV 95.5% / ICM 4.5%）がある。

このグラフを見ると、cEV戦略はチップを最大にして1位を狙うために多くの資金を犠牲にしていることがよくわかる。この線は他と大きく乖離しているため、他の戦略間の小さな違いが見えにくくなっている。

実験#2 - 1000人のフリーズアウトトーナメント

再現実験は、科学者が結果の有益性に確信を持つための重要な方法の一つである。実験を繰り返し、変数を分離することは、科学的方法の基本原則のひとつである。
次の実験では、より大きなフィールドを使って上記の方法を繰り返す。先の実験での結果は、賞金構造やプレイヤー数による偶然かもしれないことを考慮すべきである。

《設定》

前回と同じ設定で、今回は1000人規模のフリーズアウトをシミュレートする。

1000人のフリーズアウトMTT
フィールドの15%がITM
プッシュ/フォールド
BB = 平均スタックの1/7
6種類の戦略
全てのプレイヤーがお互いの戦略を知り、それに戦略を調整する
サンプルサイズ：100,000トーナメント

《結果》

前回と同様、ICM に早く切り替えた戦略の方が平均して好調であることがわかる。ROI%の下落は、(cEV 50% / ICM 50%)と(cEV 62.5% / ICM 37.5%)の間のどこかで始まるようだ。

どちらの実験でも、ICMはフィールドの残り50%から37%の間の結果に統計的に有意な影響を与え、15%のバブルを大きく上回っているようだ。この信頼区間では、純粋なICMがICM50%より優れていると主張することはできないが、一般的な傾向は以前の結果と一致しているようである。

《プレイスメント》

ここでも以前と同じ傾向が見られる-ICMに早く切り替えたプレーヤーは、全体的にITMをする頻度が高い。

《ベースラインとなるプレイスメントとの比率の変化》

《期待値》
プレイスメント毎の期待値の比較

《ベースラインのプレイスメントのEVへの変化》

200人の実験と同様に、早くICMに切り替えたプレイヤーは、最も高いプレイスメントのEVがわずかに低い代わりに、ITMの頻度が高いことがわかる。逆に、ICM に切り替えるのが遅いプレイヤーは、より大きなスタックを構築し、より大きなリスクを負う傾向があり、その結果、最も高いプレイスメントではより高い EVを得るのと引き換えに、 ITM プレイスメントの発生頻度はより低くなる。
ここでは、プレースメント毎のベースラインのEVの変化を見ることができる：

実験#3 - より多くの戦略

《設定》

90人MTTフリーズアウト
13人がITM
プッシュ/フォールド
BB = 平均スタックの1/7
9種類の戦略
全てのプレイヤーがお互いの戦略を知り、それに合わせる
サンプルサイズ：100,000トーナメント

《比較サンプル》

ICM 100%
cEV 12.5% / ICM 87.5%
cEV 25% / ICM 75%
cEV 37.5% / ICM 62.5%
cEV 50% / ICM 50%
cEV 62.5% / ICM 37.5%
cEV 75% / ICM 25%
cEV 87.5% / ICM 12.5%
cEV 100%

《結果》

ICM戦略に早く切り替えたプレーヤーがより多くの利益を上げるという、以前の実験と同じ傾向が見られた。

より戦略的に類似した戦略があるため、この結果には若干のノイズがある。しかし、一般的な傾向は変わっていない。

注目すべきは、純粋なcEV戦略がより多くの価値を失っていることと、他のすべてのプレーヤーのEVが前回の実験に比べて増加していることである。これは、あなたの期待値がトーナメント内の悪いプレーヤーの数の関数であることを示している。

cEV (75% / ICM 25%)戦略以下は、統計的に確信を持って負けていると言える。バブルはフィールドの残り14.4%で発生しているが、フィールドの残り25%でICMに切り替えたプレイヤーは負けている。これは、ICMがバブルのかなり前に統計的に有意な影響を与えるという考えを補強している。EVとプレースメントの分析は省略する。

実験#4 - スタックの深さを変える

これまでの実験では、平均スタックはすべて7BBだった。次に、スタックの深さを5BBから10BBの間で変化させ、それが結果にどのような影響を与えるかを見てみよう。

《設定》

90プレイヤーMTTフリーズアウト
13人ITM
5BB、7BB、10BBのプッシュ/フォールド
6種類の戦略
全てのプレイヤーがお互いの戦略を知り、それに合わせる
サンプルサイズ: 各テストにつき500,000トーナメント

《アベレージ5bb》

《アベレージ7bb》

《アベレージ10bb》

《スタックの深さを変えた場合の分析》

すべてのケースにおいて，(cEV 62.5% / ICM 37.5%)戦略以下は統計的に有意なレベルで成績が悪かった．プッシュ/フォールドの幅が狭いため、10BB の深さではスキルエッジが縮小すると推測できる。しかし、これは単なる分散かもしれない。

実験#5 - 誤解への対処

多くのプレイヤーは、ICMはトーナメントが停止し、計算後に支払いが行われると仮定していると思っている。そうではない。スタックの価値を見積もることと、トーナメントを止めることは同じではない。この誤解は、おそらく以下の事実から生じている：

ICMはファイナルテーブルでのディールによく使われる。
ICMは次のラウンドでポジションやブラインドが増えることを考慮しない。

ICMは戦略について何の仮定もせず、誰がインポジションなのかや、「レンジ」という言葉が何を意味するのかも知らない。ICMが行うのは、スタックのプレイスメント確率を見積もることだけだ。
この実験では、プレイヤーがICMの概念を知らなくてもICMが機能することを示す！

《設定》

今回は、ハーフスタックプレイヤーとフルスタックプレイヤーの2つのプレイヤーグループをシミュレートする。
どのプレイヤーもcEV戦略を使うので、このシミュレーションでは誰もICMを気にしない。

ハーフスタックとフルスタックの2つのプレイヤーグループ
全員がcEV戦略
BB = 平均スタックの1/7
200人のMTT、フィールドの15%がペイアウト（Exp #1と同じペイアウト構造）
プッシュ/フォールド
100ドルバイイン
サンプルサイズ: 250,000トーナメント

《結果》

ここでは、ハーフスタックとフルスタックのプレイヤーのシミュレーション結果と、ICMの予測結果を比較している。
例えば、"Top 15%"はトーナメントで上位15%に入る頻度を意味する。「トップ50%」は、トーナメントで上位50%に入る頻度を意味する。ICMはハーフスタックグループのトーナメントEVを$67.74、フルスタックグループのトーナメントEVを$132.26と予測している。
これらの予測がシミュレーション結果にどれだけ近いか見てみよう：

ICMは各プレイヤーのEVを予測し、推定結果とシミュレーション結果の差はわずか$0.39であった。これらの結果は、トーナメントに参加するプレイヤーがその概念を知っているかどうかに関わらず、ICMがトーナメントエクイティの価値ある正確な予測因子であることを示している。この結果はまた、ICMが重要な場所で最も正確であることも示している。ICMは、賞金が集まるトップ付近でより強い力を発揮する。

実験結果はあなたの戦略にどう影響を与えるか

これらの実験の目的は、いつICMが重要になるかを見つけることである。GTO ウィザードでは、トーナメント中盤でも戦略が大きく変化することを実証することができる。
GTOウィザードを使い、序盤や中盤のMTTのICM戦略を研究することで、ライバルに差をつけることができる。

以下の図は、トーナメントを通してどのように戦略が変化するかを示している。これは、Exp#1 で説明したように、200 人のプレイヤーのペイアウト構造に基づいている。

例1.LJのRFI

ここでは20BBディープでの最適なLJのオープン戦略を見てみよう。比較を容易にするため、全プレイヤーに20BBスタックを割り当てた。頻度はあまり変わらないが、レンジの形は劇的に変わる。

MTTが進むにつれて、オープニングレンジがいかにブロッカーくを重要視するかに注目してほしい。リスクプレミアムが高くなるにつれ、ポストフロップのプレイよりもブラインドを奪うことによるEVが多くなる。ポストフロップのインプライドオッズは、スタックオフの条件が厳しくなり、リスクプレミアムが高くなったために低下する。その結果、ドローハンドは3ベットレンジをブロックするハンドと置き換わる。

例2.BBディフェンス

ICMの効果はビッグブラインドで最も顕著である。これも20BBのポットである。トーナメントが進むにつれて、LJオープンに対してBBがどれだけタイトになるかを見てみよう！

トーナメント中盤でも、BBのフォールド頻度は19.6%から35.5%に変化している。

BBのレンジのほとんどのハンドはブレークイーブンに近いので、リスクプレミアムの小さな変化はディフェンスレンジに大きな影響を与える。

例3.LJvsBTN3bet

LJがオープン、BTNが3ベット、LJがアクション。ここでのLJの戦略の変化を見ていこう。

トーナメントが進むにつれ、LJのコール回数が減っていることに注目したい。その代わりに、LJはAI or フォールド戦略を選択し、BTNに対して「ICMチキン」のようにプレイしている。ICMがプリフロップとポストフロップの戦略に大きな影響を与えることは明らかである。GTOウィザードのこのような戦略の変化を見ると、私たちのプッシュ/フォールドの実験は、中盤のMTTスポットにおけるICMの優位性の全容を捉えていないと思われる。

ICMの代替策

ICMは不完全なモデルであることに留意すべきである。より正確なトーナメント評価を行うことは可能だが、それは非常に小さなゲームツリーに対してのみである。Helmuth Melcher (Holdem Resources Calculatorの創設者)によるこの優れた論文は、従来のICMと代替モデルを比較したものである。3つのトーナメントエクイティモデルが、正確なNE戦略(PI-CFR+と表記)と比較され、また互いに比較された。オリジナルの ICM 手法は「Harville」と呼ばれ，発明者の名前をとって「Malmuth-Harville」と呼ばれることもある．

《シミュレーションの結果》

以下のセクションの表は，指定されたエクイティ・モデルに基づく一方だけの均衡戦略を使用する一方のプレーヤーと，PI-CFR+戦略を使用するもう一方のプレーヤーとのシミュレーション結果を示している．

Harville (ICM)とRobertの公式はともに非常に良い結果を出し、完璧な戦略に対して負けたのはバイインのわずか1%であった。特筆すべきは、Robertsは完全戦略に対して負けが少ないが、Harville（ICM）がRobertsに勝っていることである。

私たちがICMを好む理由は、より効率的だからである。オリジナルのICMの計算は、何千人ものプレーヤーを瞬時に評価する事もできる。

ICMにはいくつかの限界があり、主なものでは、次のラウンドでブラインドが増えること、ポジションがローテーションすること（FGSを使わない限り）、スキルエッジ、ポジションなどを無視することだ。一般的にICMはチップリーダーのアドバンテージを過小評価する傾向がある。しかし、全体的に見れば、ICMは構想から35年経った今でも非常に強力な計算式である。

結論

この実験の目的は、MTT において ICM がどの時点で重要なファクターとなるかを調べることであったこれをテストするために、トーナメント中のさまざまな時点でチップEV モデルからICMモデルに切り替わるサンプルを用いて、何百万もの MTT をシミュレートした。

その結果、早くにICMに切り替えたプレイヤーは、遅くにICMに切り替えたプレイヤーを常に上回っていた。

途中でICMに切り替えた戦略は一貫してリターンが増加したが、その増加は比較的小さく、誤差の範囲内であった。ICMが統計的に有意な影響を及ぼすのは、15%のペイアウト構成でフィールドの残り50%から37%の間のどこかであることが、高い信頼性をもって示された。ICMに切り替える "スイート・スポット "は、バブルのおよそ3倍で発生すると推測できる。ICMがバブルのかなり前から戦略に大きな影響を及ぼしていることは明らかだろう。

この記事が気に入ったらサポートをしてみませんか？