今日も彼らはYESもNOも言わない

2022年2月23日 06:34

Photo by Pacto Visual
現地時間2022年2月22日

最近気晴らしとその他色々な目的でZのつくゲームでたまに遊んでいます。ポーじゃないよZから始まる闇のゲームだよ。

かなり厳しいリハビリが必要なのでのんびり遊んでいますが、その際にぼんやりと考えていたことを書きました。つまりはポエム以外の何物でもありません。なにかそれっぽいことを書いてるだけで何の役にも立ちません。

さてこれはエンジニアの話です。最初からそういう話です。彼らに何か質問をすると、たいていとても困った顔でなかなか答えてくれません。埒が明かないのでせめてYESなのかNOなのか言ってくれ！と半ば糾弾のように追い詰めるも彼らはなぜか頑なに口を割ろうとはしないのです。果たしてどんな宿命で何をかばっているのか。

彼らの頭の中ではだいたいこんな事が起きています。

出典
The Multiple Meanings of a Flowchart
Nathan Ensmenger

複雑な前提条件が行きかい、猛烈な速度で条件分岐しています。そして目の前の問にふさわしい回答を導くための条件設定およびカテゴリを求めて必死に考えを巡らせています。

そもそもですが、日常の会話というのはたいていものすごく適当です。前提条件は互いの妄想であり、話が合っていると思っているだけでよくよくつっこんで議論しようと思うと全く共通の土台に立っていないこともしばしばあります。

エンジニアというのはそういうことが極めて苦手な人種なので、正直みんなが何を言っているのかわけがわかりません。たとえば好きな食べ物はなんですか？と聞かれたらとりあえず晩ごはんという設定を置き、一年で何回食べたくなるか、好きと言えるのはどれくらいの頻度からか、といった閾値を瞬時に決定して返答します。いつも理屈っぽいこと言ってるのになんでこんな簡単なことはすぐに答えられないの？という無言の圧力を幾度となく経験したことにより獲得した日常会話を処理する機能です。もちろん私の個人的な話です。

さて何が言いたいかというとGTOの話ですね。最初からGTOの話です。世間のGTOは事実上ニアリーイコールでGTO SOLVERのことですね。ナッシュ均衡解を参考としたポーカー戦略、くらいに平たく書くとけっこう近い気がします。

SOLVERの中身についてよく知らないのでいい加減ですが、GTO SOLVERのEVは条件Yのとき、戦略Xの期待値はいくらか、みたいな感じで求めていくのではないでしょうか。いや適当です。SOLVER MONKEYである私などはこの条件部分をGTO SOLVER曰く…とネコの教えのように信心深く設定し、期待値が最大になったり>0になったりする戦略を探すわけです。

さてそのGTO SOLVERでこの条件を設定したりすると、実際はまあこういう事が起きるのではないかと妄想しています。

条件Y
相手のレンジ： AdKc: 4, AdKd: 4...7d6d: 1... 2c2s: 1.
かつ
こちらのアクションxiに対するアクション
x1 → vs 30%： AdKc: r1 0.1 r2 0.5 c 0.4 f 0, ...7d6d: f 1 ... 2c2s: r 0 c 0.2 f 0.8
x2 → vs 75%： ...
x3 → vs 150% ： ...

ここで期待値が最大になる戦略がX…みたいな？まあなんかこんな感じです。こういうのを互いにエクスプロイトし合って求めていくと。何を言っているのか漠然と伝わっているという前提のもと進めます。ポエムなので適当です。

何もかも前提条件を確定させて、そこで得られた戦略をEVというものさしで評価しているのではないか、SOLVERはそういう機械なのではないか、とまあなんとなくそういう風に想像しています。美しいですね。

さて、GTOの素晴らしいところは、一旦自分のPCで得られる範囲で計算結果に落とし込めばとりあえずあまりEVを損なわない戦略を得られるというところにあります。人間に解釈可能な領域も多く、可視化して手元に置くことができます。

つまり何が言いたいかと言うと、さよならGTOということです。GTOなんて捨てて街にでよう。

そうです。これはさよならGTOの話なのです。最初からそういう話でした。繰り返しますがレクリエーショナルプレーヤーが多いステークスでぼうっと考えた程度の与太話です。でもそういった固定戦略が通用するレベルの相手なら、応用可能な部分もあるかもしれません。

このGTOという部分は非常に複雑で機械的でありなおかつ人間的で美しいです。GTO曰く…で全て解決する魔法の言葉です。ですが別の固定的なあるいは古典的な条件設定方法で期待値を見積もっても良いではないですか。闇のゲームもやはりゲームです負けても多くの場合は死んだりしません。

たとえばこういうのはどうでしょうか。今あなたの目の前には何を血迷ったのかオープンしてしまったとんでもないゴミハンドがあります。6MAXでUTGから52oでオープンしたあなたはBBとHUです。フロップでAKと落ちたボードでターンでガットを拾い、衝動に駆られてダブルバレルを打ちました。リバーが落ちて、淡い期待も束の間、当然ゴミのままです。

さてここでGTOの結果を振り返りましょう。

プリフロップでフォールドです。

使えねえです。だって52oでオープンしたシミュレーションなんて持ってないもの。というわけであなたはスピリチュアルな感じで戦略を決めるしかなくなりました。GTOを忘れてシンプルなフレームワークだけ残して、逆回転で手に馴染む形で考えてみます。条件Yを何かこう魂を揺さぶる感じのやつに切り替えてみましょう。

たとえばシンプルにこう考えます。

ここでチェックして諦めたらEVは0。だから期待値が0以上であればベットした方が良い。つまりは条件Yのとき期待値が0以上ならベット。その条件Yは何か。

逆回転といったのはこういうことです。今ここにあるゴミハンドでベットするかチェックするか、それだけが戦略です。バランスなんて知りません。そこから条件を逆算しようじゃないか。つまりそういうことなので、ベットしたいわけです。ここでどういう条件ならこのベットが正当化されるのかを考えて、その条件が厳しそうかどうかを見積もります。

今回ならAKボードでBBが2回コールしてきているわけですが、まあトップペア以上はありそうです。おそらくAだけのハンドがだいたい降りてくれるなら打っても損はなさそうです。自分のレンジと噛み合わないって？まあ良いじゃないですか。適正以上に降りてくれるならこっちのハンドはなんだって良いのです。逆に全く降りないのなら全てのゴミハンドで諦めます。

よってしれっと150-200%くらい打ちます。気まぐれで75%も良いでしょう。そもそも期待値というのは平均みたいなもので、それは大数の法則に支配された無限仮想空間の話です。宝くじを無限回買う人なんていないのです1回当たればそこでゲームセットです。ここは一つ流れに身を任せましょう流れ論者になりましょう。

よってあなたはベットします。そして無事コールされました。相手はリバーでなにか絡んだ2ペアでした。あーあ。

でも気にしてはいけない。Aヒットを下ろせれば+EVだったはずなのです。そういう世界線もあったはずなのです。でも次があるならばAヒットでは全部コールされるかもしれないのでそれはまたその時に考えよう。

ここで話題にしていたのは今ここにおける期待値を最大化する条件Yなのであって、相手はたぶん生涯で3回くらいしかHUにならない条件集合体なのです。あなたの戦略を読み解き、対応してくる相手でないならば、それは一期一会、細かいハンドの仕分けで悩まなくたって良いではないですか。

言い換えれば、この記事で話題にしてきたこの条件設定こそが一つのメソッドそのものです。すなわち幻のGTOは捨てて血を吐きながらソルバーを回してノードロックしようということなのです。この過程には経験的なものが多分に反映されるはずで、あなたが想定する相手はどのハンドをどうプレーするのか、ターンで削られたレンジはリバーでどうなっているのか。その条件を探る過程で細部にネコはやってくるのです。和解しましょう。そしてインスピレーションを信じて、大胆にシミュレートをしましょう。エクスプロイトしましょう。つまり最初からこれはノードロックの話だったのです。そして徹頭徹尾、ネコの話だったというわけです。

この記事が気に入ったらサポートをしてみませんか？