見出し画像

Dynamic Size:GTOの進歩

はじめに

今回の記事は 【GTO wizard AIによるDynamicサイジング】です! 従来のBetサイズを一新する画期的なBetサイジングになるかもしれません。
GTO wizard Blogの意訳です。
翻訳が伝わればいい感でやっており拙い部分があるため、コメントにて教えていただければ嬉しいです。
それではいってらっしゃい!
意訳・翻訳コンテンツはこちら↓

翻訳・引用元

こちらからの登録で10%オフになります☟

目次


ダイナミックサイズ: GTOの画期的な進歩

Dynamic sizingは各スポットで最大EVになるベットサイズ戦略であり新しいポーカーのアルゴリズムです。
上手く使われたシンプルな戦略は下手で複雑な戦略よりも常に良いパフォーマンスを発揮します。
ブラウザベースでの学習ツールの導入以来、ポーカープレーヤーにとって、Betサイズが多すぎる GTOソリューションから学ぶことは大きな課題となってきました。複雑な GTO戦略は解釈が難しく、実装は事実上不可能です。
シンプルなソリューションは学習が容易ですが、堅牢性が低く、最適なサイズ設定やさまざまなベットサイズに対応する方法がわかりません。
GTOwizard社チームは人工知能の力を利用して、この問題に対する洗練された解決策を開発しました。

GTO wizard Blogより

ダイナミックサイジングは不必要なBetサイズがなくシンプルな戦略です。
ダイナミックサイジングにはキーとなる特徴があります。

  • あらゆるポイントで、最適なベットに自動的に単純化するか、サイズを引き上げます。

  • 希望するベットサイズの数を選択してください。

  • 必要に応じて、ソルバーが選択するサイズのリストを定義します。

  • ソルバーがダイナミックサイジングをいつ、どこで使用するかを指定します。

  • さまざまなベット サイズでノードを臨機応変に再解決します。

  • カスタマイズされたソリューションに対してトレーニングします。

Dynamic vs Automatic

GTO wizardには、DynamicとAutomaticの 2 つの自動簡略化方法があります。これらは本質的に同じアルゴリズムです。どちらの場合も、ソルバーは事前定義されたベットまたはレイズのサイズのリストから検索して、各ノードでの最適なサイズを見つけます。主な違いは、ダイナミック モードでは、どのBetサイズを考慮する必要があるか、および各ポイントで使用するサイズの数をユーザーが設定できることです

  • Automatic:GTO wizardは、使用するサイズの数を決定し、SPRに基づいて事前定義されたサイズのリストを調整します。ソルバーは、決定ごとに最適なベットまたはレイズのサイズのセットに自動的に単純化します。通常、これは新規ユーザーにとってベストな選択肢です。

  • Dynamic:希望するBetまたはRaiseサイズの数と、ソルバーが考慮するサイズを選択します。ソルバーは、各決定点で最適なベット サイズに自動的に単純化します。このオプションを使用すると、より細かい設定が可能になります。

問題

ソルバーに慣れていない人にとっては、これが問題であることすら不思議に思えるかもしれません。なぜ従来のソルバーは最適なベット サイズを示すことができないのでしょうか?
問題は、ポーカーは非常に複雑なゲームであるため、ベッティング ツリーを抽象化して計算可能にする必要があることです。 従来のソルバーでは、ソルバーを扱う人間が使えるBetサイズを正確に定義する必要があります従来のソルバーがどのように機能するかについて詳しくは、こちらをご覧ください。

ソルバーにどのようなベットサイズに設定するべきかをどうやって知るのでしょうか?これが問題のコアです。
従来の簡略化手法は、多くのBetサイズを持つ複雑な戦略を解決し、その後、ソルバーが最も頻繁に選択したBetサイズを使用してReSolvingする(頻度分析)、または各サイズを個別にResolvingし、複雑な戦略をプレイする場合と比較して最もEVが少なくなるサイズを選ぶ(EV分析)ことを含みます。 しかし、このプロセスは長くて退屈です。一つのポストフロップツリーを最適化するためには、何千回もReSolvingする必要があります。そのため、ポーカープレーヤーは経験則やヒューリスティックを使ってベットツリーを最適化してきました。 そこで、GTO wizard社チームは新しい手法として「ダイナミックサイジングアルゴリズム」を開発しました。

上記要約
従来の簡略化手法は、ベットサイズの最適化に時間と手間がかかるため、ポーカープレーヤーは経験則やヒューリスティックを使ってベットツリーを最適化していました。そこで、私たちは新しい手法として「ダイナミックサイジングアルゴリズム」を開発しました。

最適なBetサイズを見つける方法

Dynamic アルゴリズムは使用できる全てのBetサイズをスキャンし、戦略的に付加価値が最も少ないBet/Raiseサイズを排除します。このアルゴリズムが繰り返され、必要な数のサイズのみが残るまで最も価値の低いBetサイズが継続的に削除されます。 通常、これは非常に長い計算になります。しかし、人工知能の力のおかげで、あらゆるベッティング戦略の価値を非常に迅速に概算することができます。

https://blog.gtowizard.com/dynamic-sizing-a-gto-breakthrough/

最適サイズを見つけるために、利用可能な全てのBetサイズの頻度、EV、および除去リグレットを比較して、独自の機械学習アルゴリズムの入力として使用される一連の特徴を生成します。 そのアルゴリズムの出力により、削除するサイズがわかります。次に、 GTO Wizard AIを使用してベッティング ツリーをReSolvingし、最も価値のあるサイズのみが残るまでこのプロセスを繰り返します。
最終的な結果、効率的でシンプルかつ最適なベッティング戦略になります。

ベンチマーク

次に問うべきことは、このアルゴリズムはどの程度正確なのかということです。それを調べるために広範なベンチマークを実行しました。ここでは調査結果の概要を紹介しますが、動的ベンチマークの記事全文はこちらでご覧ください。

Dynamicアルゴリズムは最良のシングルサイズ戦略と比較して、リバーでの平均EV損失はわずか0.05%ポットです。8 つの異なるサイズの複雑なリバー戦略をプレイする場合と比較して平均EV損失はわずか0.30%であり、単一サイズの固定戦略よりも優れたパフォーマンスを発揮します。

https://blog.gtowizard.com/dynamic-sizing-a-gto-breakthrough/
https://blog.gtowizard.com/dynamic-sizing-a-gto-breakthrough/

GTO wizard AI vs Slumbot

GTO wizardAI. vs Slumbotを行った時、150,000ハンドを試した結果、最高のパフォーマンスを示したのは1サイズのDynamic サイジングであることがわかりました。 理論的には、複雑な戦略は単純な戦略よりも優れたパフォーマンスを発揮するはずですが、7 秒間の時間制限により、より単純なアプローチの方がより高い精度に達し、変動が少なくなりながら 50% 優れたパフォーマンスを得ることができました。

https://blog.gtowizard.com/dynamic-sizing-a-gto-breakthrough/

ポーカー プレイヤーは戦略を単純化することで EV を失うことを恐れることがありますが、経験からその逆であると自信を持って言えます。簡素化された戦略を使うことは、学習効率とWin Rate が向上するためご安心してください。ゲームから不必要な複雑さを取り除き、最も重要なことに集中し始めると、精度と自信の両方が向上することがわかります。


まとめ

  • Dynamicサイズでのシンプルな戦略は学習効率とWin Rateを向上させることができる。

  • Dynamicサイズのアルゴリズムは全てのBetサイズをスキャンし、戦略的に付加価値が最も少ないサイズを排除する。このアルゴリズムが繰り返され、必要な数のサイズのみが残るまで最も価値の低いBetサイズが継続的に削除され、結果的にシンプルな戦略になる。

  • Dynamicサイズのベンチマークは、1サイズと8サイズの戦略と比べてもEVロスが少なく、試行時間を短くした場合はより良いパフォーマンスをする。

AI要約

Dynamic sizingはポーカーのベットサイズを最適化する画期的なアルゴリズムであり、戦略を簡素化し、不要なベットサイズを排除します。ユーザーは希望するベットサイズの数を選択し、ソルバーが考慮するサイズのリストを定義できます。アルゴリズムは利用可能な全てのベットサイズをスキャンし、最も価値の低いサイズを削除して効率的で最適なベッティング戦略を提供します。Dynamic sizingは複雑な戦略を上回り、学習効率と勝率を向上させます。ベンチマークでは、固定サイズと複数サイズの戦略と比較して最小限のEV損失を示し、優れたパフォーマンスを発揮します。

POKER GYM限定コンテンツ

LINEの友達登録をすることで、限定配信の記事を見ることができます。
ぜひ、登録してください!!

こちら

Poker GYMでは、国内初のマネジメント型パーソナルトレーニングを用いて、お客様のポーカー力向上をサポートいたします。
効率よく目標を達成するためには、正しいトレーニングだけではなく、座学の習慣を身につけることが必要です。


この記事が気に入ったらサポートをしてみませんか?