見出し画像

学術書自主ゼミという異世界転生譚

望外の発見であった。

先日友人とゲーム理論の自主ゼミを始めた。実務やスキルなどの実用性は一切度外視して、純粋に知的好奇心を満たし「学ぶって楽しい」という原点に立ち返ろう、というスローガンを掲げた。が、とんでもなかった。実務に役立たないどころか、むしろ最強のスキルを身に付けるビジネスパーソン養成ツールとしての「異世界への扉」を開いてしまった感すらある。

ゲーム理論の数式がすぐ役立つ、と言いたい訳ではない。日々の実務で自然と培われた業界知識や慣行などの鎧が全て剥ぎ取られた状態で、「行間」という広大な砂漠に放り出され、自身の純粋な思考力に向き合うという「異世界転生」にある種の新鮮さを覚えたためである。


学術書自主ゼミという非日常の正体

学術書自主ゼミという試みがかくも非日常的に感じるのは、おそらく以下の3つの点で、日常でなかなか得難いシチュエーションだからだろう。

  • メンバー同士で会社/業界も大学時代の専攻も異なるため前提知識や共通認識に乏しい中で、相手に内容を分かりやすく伝える必要がある

  • 大学院レベルの学術書のためただでさえ記述が簡潔かつ抽象度が高いのに全員が門外漢のため、非常に広い行間を丁寧に埋める必要がある

  • 議論が定義→定理→証明、定義→定理→証明、…という流れで進むため、高度な数学を用いた緻密な論理展開を理解する必要がある

言うまでもないが大学院レベルのゲーム理論の学術書は、学部レベルのミクロ経済学や経済数学を習得した読者を想定して書かれているため、そもそも行間が広くて当然である。本来は初級の教科書から読むのが王道だが、敢えていきなり抽象度の高い議論に触れ行間を埋めに行くことが、非常に汎用的な問題解決力の養成にもってこいでは、と図らずも気付いた次第である。

以下にCase StudyとしてNash均衡の章を取り上げ、シンプルに記述された理論のエッセンスを真に理解するために、論点ベースで思考を整理しながら行間を埋めていくプロセスを見てみよう。自主ゼミに限らず、何かを筋道立てて相手に物事を伝えるためのトレーニングとして有用に感じられるはずだ。

Case Study:Nash均衡の解説

例えば、ゲーム理論における最も重要な概念の一つであるNash均衡は、利得関数$${f}$$を用いてこのくらいのレベルで簡潔に記述される。


  • 前提:自身の利得関数$${f_i}$$は、自身の他のプレイヤー全ての戦略の組$${s=(s_1, \cdots, s_n)}$$の関数として$${f_i(s)}$$と表される

  • 準備:自身を除く他のプレイヤーのみの戦略の組を$${s_{-i}=(s_1, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n)}$$と定義すれば、自身の利得関数を$${f_i(s)=f_i(s_i, s_{-i})}$$と書き直すことができる

  • 定義:プレイヤー$${i}$$の戦略$${s_i}$$が他の$${n-1}$$人のプレイヤーの戦略の組 $${s_{-i}}$$に対する最適応答であるとは、 $${f_i(s_i, s_{-i})=\displaystyle\max_{t_i \in S_i}f_i(t_i, s_{-i})}$$をいう

  • 定義:プレイヤーの戦略の組 $${s^*=(s_1^*, \cdots, s_n^*)}$$がNash均衡点であるとは、全てのプレイヤー$${i(=1, \cdots n)}$$に対して戦略$${s_i^*}$$が他のプレイヤーの戦略の組$${s_{-i}^*}$$に対する最適応答であるときをいう


上記の内容を分かりやすく人に伝えたい場合、どのように考えるだろうか。前述の通り前提知識を有する読者は、この記載でも十分咀嚼が可能であろう。ここでは私を始め全くゲーム理論に馴染みがなく、Nash均衡という言葉を聞いたことがある、という程度の前提知識の読者を想定している。

記載されている内容自体をかみ砕いて説明するだけでも良いが、「腑に落ちる」ためには、そもそも何を問題視していて、その問題を解くためにどう順序立てて考えていくか、というストーリーが不可欠である。そこで、次のように考えながら、行間を埋めていこう。

論点ベースで行間を埋める

そもそも「論点」とは?

そもそも論点とは何か。問題解決における論点とは、「答えを出すべき問い」のことであり、形式的には疑問形で表現していく。論点の詳細な解説は例えば以下のサイトに譲るとして、以下ではNash均衡のエッセンスを理解するために、適切な問いを立てながら議論を進めていきたい。

どう相手を予測し、どう行動するか?

そもそも今回考えている問題設定は「参加者同士で自身の採るべき行動が相手の行動に依存する状況において、互いに話し合いをせず独立に相手の行動を予測して自身の行動を決定する場面」である。

これを非協力ゲームというが、例えばじゃんけんで「相手がグーを出しそうだからこちらはパーを出す」というくらいにありふれた状況である。そして非協力ゲームにおける最重要論点は「個々の参加者が自身の利益最大化を目指す時、相手の行動をどのように予測し、どのような行動を選択するのか?」である。この論点に沿って順序立てて考えることが、上記の論理展開の行間を埋める第一歩である。

とりあえず予測ができたとして、その時どう行動するか?

予測が変わればそれに応じて行動も変わるため、まずは相手の行動を固定した場合、つまりとりあえず「相手はこう動く」と予測できたとして、その場合に自身がどう行動するかを考える。このように考えると、自身の利得関数は自身と相手の行動に依存するので、自身の行動とそれ以外の相手全員の行動を区別して記述した方が便利だ、という発想に行きつく。かくして以下のお膳立てをしよう、となる訳である。

  • 前提:自身の利得関数$${f_i}$$は、自身の他のプレイヤー全ての戦略の組$${s=(s_1, \cdots, s_n)}$$の関数として$${f_i(s)}$$と表される

  • 準備:自身を除く他のプレイヤーのみの戦略の組を$${s_{-i}=(s_1, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n)}$$と定義すれば、自身の利得関数を$${f_i(s)=f_i(s_i, s_{-i})}$$と書き直すことができる

この準備ができれば、$${f_i(s_i, s_{-i})}$$において$${s_{-i}}$$を固定した場合の自身の行動の選択肢のうち、自身の利得を最も高める行動を、以下の最適応答として定義するのは自然な流れであろう。

  • 定義:プレイヤー$${i}$$の戦略$${s_i}$$が他の$${n-1}$$人のプレイヤーの戦略の組 $${s_{-i}}$$に対する最適応答であるとは、 $${f_i(s_i, s_{-i})=\displaystyle\max_{t_i \in S_i}f_i(t_i, s_{-i})}$$をいう

相手の行動をどのように予測するか?

ここまで、一旦「予測できたものとして」最適行動を考えたが、そもそもその予測通りに相手が動くとは限らず、また相手もそのような自分の行動を予測して最適行動を選ぼうと考えている。このような状況をを踏まえて次に考える論点は、「相手の行動をどのように予測するか?」である。

例えばプレイヤー$${i}$$と$${j}$$という2人の非協力ゲームを考えると、$${i}$$は$${j}$$の行動を予想し最適応答を選択するが、同様の行動を$${j}$$も採る結果、以下の状況が生まれる。

 $${i}$$「$${j}$$の行動を$${s_j}$$と予想した上で、最適応答$${s_i}$$を選択する」
→$${j}$$「$${i}$$の行動を「$${j}$$の行動を$${s_j}$$と予想した上で、最適応答$${s_i}$$を選択する」と予想した上で、最適応答$${s_j^*}$$を選択する」
→$${i}$$「$${j}$$の行動を「$${i}$$の行動を「$${j}$$の行動を$${s_j}$$と予想した上で、最適応答$${s_i}$$を選択する」と予想した上で、最適応答$${s_j^*}$$を選択する」と予想した上で、最適応答$${s_i^{**}}$$を選択する」
→$${\cdots}$$

このように「相手の出方の読み合い」は際限なく続き、どのように相手の出方を読んだら良いかは「各人は自らの利益を最大化する」という行動原理だけでは決まらない。もしこのような2人の読み合いの連鎖が停止するとしたら、それはどのような状況だろうか?

結論としてそれは「互いに相手の最適応答を予想している」時である。つまり、2人が互いに予想する相手の行動の組を$${(s_i, s_j)}$$、予想に対するそれぞれの最適応答の組を$${(s_i^*, s_j^*)}$$とすると、2人の推論が停止する条件は、$${s_i=s_i^*, s_j=s_j^*}$$が成立するときである。

この条件は、2人の予想と相手の最適応答が一致し、それに対応する自身の行動もまた最適応答のため、行動$${s_i^*}$$は行動$${s_j^*}$$に対する最適応答であり、行動$${s_j^*}$$は行動$${s_i^*}$$に対する最適応答である。この議論を一般化し、全参加者の行動が互いに他の参加者の行動の組に対する最適応答となるとき、その行動の組はNash均衡を成す。

  • 定義:プレイヤーの戦略の組 $${s^*=(s_1^*, \cdots, s_n^*)}$$がNash均衡点であるとは、全てのプレイヤー$${i(=1, \cdots n)}$$に対して戦略$${s_i^*}$$が他のプレイヤーの戦略の組$${s_{-i}^*}$$に対する最適応答であるときをいう

この時、どの参加者も自分だけ行動を変更する動機を持たず、集団の行動は$${s^*}$$で均衡する。Nash均衡点の理論の基本的な考え方は、参加者の予想と最適応答が整合的である均衡点のみを参加者の合理的な意思決定の帰結と見なすことである。逆に、均衡点以外の行動の組では推論プロセスが停止せず、必ずある参加者にとっては行動を変更した方が利得が増大するためである。

***

いかがだっただろうか。このように問いを立てながら行間を埋めることで、非協力ゲームにおける参加者の意思決定の結果もたらされる状況が、理論的には「全員が相手の最適行動を予測し、それが相手の実際行動と一致している状況」だというエッセンスを理解する手掛かりになればと思う。

学術書でシンプルに記述されていた4つのポイントの行間を埋めようとすると、その数倍のボリュームを要し、それだけ人に筋道立ててものごとを伝えるために考えるべき事柄が多い、ということが可視化されたのも面白い(文字数では500字の要点を説明するのに2,000字強を要しており、4倍である!)。

ちなみに現実世界で起こるNash均衡の事例として、以下のエスカレーター問題を取り上げているため、こちらもご参照頂ければと思う。

以上、大学院レベルの学術書を題材に、論点ベースで広大な行間を埋めることが、汎用的な思考整理と説明力アップの格好のツールになるのでは、という話であった。今後も社会人3人で取り組む学術書自主ゼミを通して気付いた発見をしたため、魅力を発信していきたい。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?