見出し画像

元ゲーム理論専攻の自分がGTOを説明してみる(Part1)

書こうとしている事

どうもしののです。

AKQゲームのような簡単なモデルと実際のゲームをどう接続するか、
という観点からの分析を書こうと思っています。
明日から使える戦略論というよりは、もっと基礎的な考え方です。
座学中の座学みたいな感じで、つまらない人にはつまらないですが、ゲームの構造を理解するという意味では、結構重要だと思うのです。

AKQゲームの応用は、各種ブログ・Noteだったり、
複数ストリートのケースは、「Applications of No-Limit Hold'em」、
少し複雑なレンジのケースは、「Play Optimal Poker」にも
書いてはいますが、ちゃんと体系化しときたいと思います。

ただし、数式をごりごりいじる、というよりは、考え方を習得する事に重きを置きます。

てな事を考えていたら、結構書こうと思っている事多いなという事で
記事何個かに分けようと思います。

この記事では、「なぜGTOの記事を書くのか?」
という前振りだけですが、GTOについては色んな議論がされる事もあり、
その整理のためにも意味があると思うのでしっかり書いています。

なぜ(他のスキルでなく)GTOの記事を書くのか?

キャプチャ

3キャプチャ

自分の経験・実力ですが、50NLz5万ハンド打ってみて、実収支は4bb/100,
EVが1bb/100くらいで、全然分散の範囲内ですが、なんとかやっていけています。
50NLに来るまでは、2~25NLまでで10万ハンドくらいでそれほど時間をかけておらず(10万ハンドなので、2~25ずっと上振れているという可能性ももちろんあります。)その理由や座学の工夫を共有したいと考えています。

座学といいますが、そもそもポーカーに必要なスキルって何でしょう?
私は、下記だと思っています。
1.数学力(確率、ゲーム理論など)
2.ゲーム力・ゲームセンス
3.対人駆け引き力(相手のレンジ推定、テル読みなど)
4.1~3の前提となる論理的思考力、学習力

※稼ぐためには、上記+ゲーム選びだとかバンクロール管理とかテーブルで嫌われないとか、もっとあると思いますが、純粋なポーカーというゲームのスキルとして。

私が、割と上達が早かった理由としては、
1については確率・ゲーム理論専攻でしたし、2については、もともと将棋、麻雀などのゲームをやっていましたし、3もそこそこあった気もしますし(比較できないですが笑)、と全般的に経験・思考の傾向がポーカー向きだったというのがあると思います。
「2.ゲーム力」については、私と同じように将棋、麻雀もできて、さらにはバックギャモンもできて、ホールデム以外のゲームも強い木原さんはが非常にすごいなーといつも思っています。
※ゲーム力と論理的思考力は被ってもいますが、周囲見ると頭が良くても、
 ゲームがそれほど得意でない人もいますので、分けています。

という事で、何かしらの共有をしたいのですが、
1~4のうち2~4って言語化しての共有は結構難しいのです。
(とはいえ、どっかでしたい気もします)
2と3はアート的ですし、4は根本すぎて難しい。。。

一方で1は純然たるサイエンスですし、論理的に説明しやすいのです。
かつ、ポーカーというゲームを考える下敷きになる、
というのが(他のスキルでなく)GTOの記事を書く理由です。

ちなみにですが、実戦も重要ですし、個別のハンド分析も重要です。
ただ、「思考のベース」がない中で、やみくもに量を重ねても上達は難しいと思うのです。
スポーツにて、誤ったフォームで練習・試合を重ねても、限界があるように。

なぜ(Exploitでなく)GTOの記事を書くのか?

GTOvsExploitはさんざん語られていますのが、結論としては、
そもそも比べる二つでないし、勝つことを目的にしたら両方必要、
としか言いようがない気がします。

大事なのは、目の前のフィールド・目の前の相手から最も稼げるプレイをする、事だけです。

稼げるプレイというのは結局は、相手に対応した戦略を考える訳ですが、
大きくは3パターンあると思っています。
1.GTOベースに、「ずらす」
2.フィッシュ相手に大きく稼げる戦略を「探索する」
3.通常の戦略と「逆の事をする」

3つといいつつ、2と3はオマケ的で1がポイントなのです。
ゲーム、特に不確実性のあるゲーム(ポーカー、麻雀など)では、
基本戦略(ここではCB打つ、ここではリーチ打つ など)を学んだうえで、
シチュエーションに応じて、アクションを変化
させていくのが、分かりやすく有効な思考プロセスです。
では、ポーカーにおいての基本は何か、というとそれがゲーム理論的なアプローチだと思っています。

じゃんけんだったら、グーの頻度が33%より高い時パー出す、
ってのはGTOなんか学ばなくとも分かりますが、ポーカーにおいては複雑すぎて何が均衡でどうエクスプロイトするかすぐには全然分からないと思います。とはいえ、ポーカーそのものを数学的に分析するのはシンドイ。ので、単純モデルから複雑化していって、理解を深めるという事を、次回以降やりたいと思います。

(補足)
2.「探索する」の例ですが、下のレートで結構ドンクを打っていた事がありました。ペアがないと降りてしまう相手には効きます。特にモノトーンではかなりびびらせる効果あって、その色がないときにはかなり降りてくれます。
あとは、2NLでは、いきなりオールインなんてのも、あるそうな。
こういうのって、「探索し」てみて、初めて気が付くもので、GTOベースでは気づかないですよね。これはこれで大事です。

3.「逆の事をする」ですが、よく本だとかtwitterなんかで、このレイズはバリューだーとかブラフだー、と書かれていますが、それの逆をやる、という単純な事です。
要は、みんながバリューと思ってくれるならブラフするし、ブラフと思ってくれるなら厚くバリュー打ちます。
シンプルなんだけど、相手が読んでくれるフィールドだと結構有効です。

あと面白いのは、こういう変な事を一定頻度でして、騙してやれーってプレイをやろうとすると、結局GTOっぽくなったりします。

(余談)
ちなみに、GTOvsExploitで一番おかしいのは、(定義次第だけど)そもそもGTOもExploitな事、ですね。
Exploitを、相手に応じた最適な戦略と定義するなら、GTO(均衡戦略)は相手の戦略に対して最適な戦略になっているので。

なぜ(本やツールもあるのに)GTOの記事を書くのか?

最初にも書きましたが、個別の本・記事はあるけど、体系化されておらず、全体感が分かりにくいから、です。
麻雀界には、「ネマタ」さんというアマチュアでひたすら麻雀戦術をブログ等で体系化して、本も出している方がいます。
その世界からポーカー界に来てみると、(少なくとも日本語のものにおいては)それぞれが断片的に見えて、結局何を学べいいかよくわからなかったのです。

noteの流行についてもこの点は課題として残っており、良質な記事が多い一方、記事にすると個別的になるので、全体感がわかりずらくなる、とも思っています。

「ネマタ」さん、程の体系化は流石に無理と思う一方で、
せめてゲーム理論の基礎のところだけは、整理したいと思っています。


次回は、中身に入ります。
が、さっそく、なぜゲーム理論においては"均衡"という概念で考えるのか、
から説明したくなってきた。。。


この記事が気に入ったらサポートをしてみませんか?