【ゲーム理論】第3章 逐次手番ゲーム

 皆さん、こんにちは。和尚です。
 本記事の内容はゲーム理論の逐次手番ゲームについてです。
 今回で第3章ですが、これまでもゲーム理論についてまとめた記事を投稿しておりますので、御覧になっていない方は良ければそちらもチェックしてください。


 本記事では、noteへの記事投稿を通じて、筆者がゲーム理論について学んだ内容をアウトプットする側面があります。今回、学んだ内容は逐次手番ゲームについてです。

ゲームの木

 逐次手番ゲームは、時系列に沿って意思決定点(各プレイヤーが意思決定するタイミング)と(選択肢)で構成される、ゲームの木という図で表現できます。このゲームの木で表現できるゲームを展開形ゲームと言います。
 ゲームの木は一番左にある意思決定点(初期点)から右へ枝分かれしながら進んでいき、枝の終点で各プレイヤーの利得が記されます。
 ゲームの木を用いて、逐次手番ゲームを図式化することで、先読みをしながら戦略を考えることが容易となり、バックワードインダクションという手法でゲームを解くことができます。

 プレイヤーが順々に行動する逐次手番ゲームでは、先に行動するプレイヤーを先手、後に行動するプレイヤーを後手と言います。ゲームを解く際は、同時手番ゲームと同様に各プレイヤーの立場で利得が最大となる最適な戦略について考えます。
 逐次手番ゲームではその性質上、後手は先手の戦略を見てから自分の戦略を判断します。つまり、意思決定する各点にて、観察した情報を基に行動を決定するのです。

 ここで例を見てみましょう。プレイヤーA(以後、A)が先手、プレイヤーB(以後、B)が後手の逐次手番ゲームを考えます。各プレイヤーが戦略X(以後、X)、戦略Y(以後、Y)のどちらかをとるとき、戦略の組み合わせは、①A、BともにX ②A、BともにY ③どちらかがX、もう片方がY となります。利得は①の場合、Aは6、Bは2 ②の場合、Aは2、Bは1 ③の場合、Xを選んだ方が7、Yを選んだ方が3 であるとします。
 このとき、後手であるBのとるべき戦略についてまず考えます。後手のBは先手のAが選択する戦略に対する最適反応をとるので、AがXをとる場合、Bの最適な戦略はY(利得3)です。AがYをとる場合、Bの最適な戦略はX(利得7)です。
 次に、AはBの最適反応を先読みし、初期点において取るべき戦略を考えます。利得を比較すべき戦略の組み合わせは、AがXをとりBがYをとるとき(利得7)、AがYをとりBがXをとるとき(利得3)、の2つです。よって、Aがとるべき戦略はXとなります。
 このようにして、各意思決定点でプレイヤーがとるべき戦略を明らかにします。

バックワードインダクション

 先ほどの例で示した通り、逐次手番ゲームでは最後の意思決定点にあるプレイヤーの戦略から遡って考えることが重要です。各意思決定点におけるプレイヤーの利得が、最も高くなる選択肢を選ぶ行為を最後の意思決定点から初期点まで遡りながら繰り返します。こうして後ろ向きに解いていくことをバックワードインダクションと言います。

 先ほどの例では、Aの戦略選択→Bの戦略選択、AがXを選択→Bの戦略選択、AがYを選択→Bの戦略選択、という3つの部分ゲームが全体ゲームの中に存在しました。部分ゲームとは全体ゲームの中で独立し、完結している1つのゲームのことです。
 バックワードインダクションでは、どの部分ゲームでも最適な戦略が選択されます。このことを「部分ゲーム完全均衡」と言います。
 部分ゲーム完全均衡は、ナッシュ均衡を精緻化したもので、すべての部分ゲームでナッシュ均衡となっていることを指します。バックワードインダクションの解は部分ゲーム完全均衡と一致します。

信憑性のない脅し

 ここで、あるゲームを想定しましょう。
 あるところに1組の夫婦がいます。専業主婦である妻は、家事をすることに不満を持っていませんが、土日の休日くらいは夫にも多少は手伝ってほしいと考えています。しかし、夫は日ごろの会社勤めの疲れもあり、休日の家事は面倒だと感じています。ここで、妻を先手のプレイヤー、夫を後手のプレイヤーとしましょう。

 戦略の組み合わせを考え、心理的な満足度を括弧内に利得としてあらわした時、①妻も夫も家事をする(妻:13 夫:9)②妻が家事をして、夫は家事をしない(妻:11 夫:10)③妻が家事をせず、夫が家事をする(妻:0 夫:5)④どちらも家事をしない(妻:0 夫:0)だとします。
 このゲームをバックヤードインダクションで解いてみましょう。
 まずは、後手の夫がとるべき戦略を考えます。妻が家事をする時の最適反応は家事をしないことです。妻が家事をしない場合は、最適反応は家事をする、になります。
 次に、妻のとるべき戦略を考えます。妻が家事をして、夫が家事をしない(妻の利得は11)と、妻が家事をせず、夫が家事をする(妻の利得は0)を比較したとき、合理的なのは妻が家事をする、です。
 このことから、夫は「家事は妻に任せっきりでもかまわないか」となり、家事をしません。

 もし、妻が「あなた(夫)が家事をしないなら、私(妻)も家事をしません」と言っても、それは妻の合理的な行動、つまり最適反応ではなく、信憑性のない脅し(ハッタリ)にすぎません。夫は、合理的な判断から当然それ見破り、家事をすることはないのです。

 このゲームのプレイヤーを妻→「政府」へ、夫→「中小企業」へ変更し、戦略については、妻が家事をする→「中小企業が危機に陥った時に助ける」、妻が家事をしない→「助けない」、夫が家事をする→「長期的な視点からの慎重な投資」、夫の家事をしない→「目先の利益に走った無謀な投資」に変更します。この場合も、先程と同様に政府は中小企業から望んだ行動(戦略)を引き出せません。中小企業は事後的な政府の援助を期待し、目先の利益を追って投資を行ってしまいます。
 このように、政府が事後的に企業を救済しないことにコミットメントしないと、民間企業から適切なインセンティブを引き出せないことをソフトバジェット問題と言います。

チェーンストア・パラドックス

 地域A、Bで独占的に販売を行っているスポーツショップ「松」があります。ライバル店の「竹」は地域Aへ出店を、同じくライバル店「梅」は地域Bに出店を考えています。ただし、「梅」は「竹」の戦略選択を見てから、出店するかどうかを決めることができます。「松」はライバル企業に対して、同じ地域における、共存か出店の阻止のどちらかをとります。
 「松」と「竹」(もしくは「梅」)の戦略と利得は次の通りです。

 ①「松」が共存、「竹」が出店(「松」:7 「竹」:4 )
 ②「松」が共存、「竹」が出店しない(「松」:10「竹」:0 )
 ③「松」が阻止、「竹」が出店(「松」:3 「竹」:-5 )
 ④「松」が阻止、「竹」が出店しない(「松」:10 「竹」:0 )
 (「梅」についても、「竹」と同様)

 このとき、「松」がとる戦略は、共存になります。ライバル店が出店しない場合は、「松」の得る利得は10に決まります。一方、ライバル店が出店した場合、「松」は共存した方が得る利得は大きくなります。そのための「松」の(弱)支配戦略として共存が選択されます。
 ライバル店の「竹」と「梅」は、「松」が共存を選択すると読み、「出店」を選択することになります。これがゲームの解となります。

 この例を展開型ゲームでも、考えてみましょう。各プレイヤーの意思決定のタイミングは①「竹」が出店or出店しない → ②「松」が「竹」に対して共存or阻止 → ③「梅」が出店or出店しない → ④「松」が「梅」に対して共存or阻止、の4つです。最後のゲームからバックワードインダクションで解くので、まず最も後手となる④の「松」の戦略の決定についてです。ここで「松」がとるべき戦略は前述した通り、共存になります。③の「梅」の戦略では、「松」が共存するのであれば、利得の高い戦略は、出店しない(利得0)より出店(利得4)です。よって、出店が最適な戦略です。同様に②、①と遡っていくと「竹」、「梅」は常に出店、「松」は常に共存することが部分ゲーム完全均衡となります。

 しかしながら、現実には「松」のように、独占的に商売を行っている店が、ライバル店の参入を阻止することもあります。店舗拡張や大型値引きによって、新規参入を阻止し、利得を独占しようとするのです。
 これをチェーンストア・パラドックスと言い、部分ゲーム完全均衡の解が現実の出来事とは異なることを示す一つの例です。

信憑性のある脅し

 夫婦間での家事を例に出しながら説明した「信憑性のない脅し」については先程の通りです。では、次は合理的な判断に基づく「信憑性のある脅し」についてです。
 既存企業が市場を独占している状態で、新規企業が新たに参入を考えています。新規企業と既存企業の戦略と利得の組み合わせは以下の通りです。

 ①新規企業が参入、既存企業が競争(新規企業:-2 既存企業:-2)
 ②新規企業が参入、既存企業が共存(新規企業:5 既存企業:5)
 ③新規企業が参入しない(新規企業:0 既存企業:10)
 
 このゲームをバックワードインダクションで解くと、新規企業は参入し、既存企業は共存する、が解となります。
 このとき、既存企業は独占している利益を守るため、新規企業に対して価格競争などの手段を使って撃退する旨の脅しを参入前にしたとします。
 しかし、新規企業からすれば、それは根拠のない脅しであり、参入することが最適反応であると判断できます。

 このままでは、既存企業は独占していた利益を守ることができません。
 そこで、既存企業は対策としてコストを支払い、投資をすることで、競争力アップを図ります。これにより、先のゲームは既存企業が「投資をしなかった」という前提でのゲーム、既存企業が投資するか否かの選択肢を含めた全体ゲームの中の部分ゲームという事になります。既存企業が投資をした場合、戦略の組み合わせは変わりませんが、投資をした場合の利得は以下のようになります。

 ①新規企業が参入、既存企業が競争(新規企業:-3 既存企業:2)
 ②新規企業が参入、既存企業が共存(新規企業:3 既存企業:0)
 ③新規企業が参入しない(新規企業:0 既存企業:6)

 バックワードインダクションで解くと、この部分ゲームの解は新規企業が参入しない(利得6)、になります。
 投資をしない部分ゲームにおける、既存企業の利得は5でした。よって、既存企業にとっては、投資をすることが合理的な判断となります。
 新規企業にとって、価格競争は脅しとして信憑性を持ちませんでしたが、投資が行われたことにより、信憑性のある脅しへと変わりました。このような先手をコミットメントと言います。

まとめ

 今回のテーマは逐次手番ゲームでした。
 本来、ゲームの木を用いて分かりやすく図式化するところを全て文章で記さなければならなかったので、分かりにくかったかもしれません。この記事と一緒に、図が乗っている本やWebページを確認すると、より理解が深まるかと思います。
 私としては前回に引き続き、図でイメージしていることを言語化することで知識や考えが整理されました。これから学ぶ内容も図表で表現されるものが多そうなので、自分が理解することはもちろん、読んで下さる方が分かりやすい表現を心がけたいです。

 最後に、本記事は筆者がゲーム理論について学び、理解した内容をアウトプットする場として活用する、という側面があります。もちろん、最大限の努力をしますが間違いがないとは言い切れませんので、ご了承ください。
 そのうえで、本記事が読んだ方にとって価値あるものになれば幸いです。

 次回は、第4章 繰り返しゲーム です。それでは。