ゲーム理論 | ナッシュ均衡について具体例で理解する【経済学との合わせ技】
ゲーム理論は経済学と数学を合わせた分野です。名前を聞いたことはあるけれど、いざ勉強しようとすると数学の記号が出てきて大変です。
もし、ゲーム理論にご興味を持たれた方がいらっしゃれば、勉強を少しでも始めやすくなるような導入になればと思う次第です。
ゲーム理論を数学的に進めていくときに、数学の記号を使います。集合や関数(写像)などです。
以下の内容では、ゲームのプレイヤーが2人というシンプルな設定で、身近な例を挙げて説明していきます。
次の用語をまず知ることからスタートします。
・プレイヤー
→ゲームに参加する人
・戦略
→プレイヤーがとる行動
・利得
→プレイヤーが獲得する利益
ここから少し高校の数学の集合と関数(写像)を使います。
【プレイヤーの集合と戦略】
【2変数関数について】
【利得表の作り方】
利得表と難しい用語ですが、中学生の場合の数で、サイコロを2個投げたときの目の組のように考えてもらえれば大丈夫です。
ここで、相手の出方が重要になってきます。
ここで、重要な考え方である最適反応とナッシュ均衡について説明します。
【最適反応とナッシュ均衡】
一般的にプレイヤーがn人いたとします。
「自分以外のプレイヤーたちがとる戦略が与えられたときに、自分の利得を最大にする戦略」を最適反応といいます。
また、「全プレイヤーが最適反応をとっていて、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせ」をナッシュ均衡といいます。
この最適反応とナッシュ均衡を判断するためには、次の合理的な他人の戦略予想の手順で考えます。
【他人の戦略予想の手順】
[1]他人の戦略を仮に予想する
[2]仮の予想の下で自分の最適な戦略を選ぶ
[3]自分の最適な戦略の下で、相手の仮の戦略が最適なら終了
※もし、相手の仮の戦略が最適でないならもう一度[1]へ戻り、別の仮の予想をして[2]と[3]の手順をする
この[1]→[2]→[3]を行い続ければ、そのうち終了するというように考えます。
先ほどの利得表を見てください。
「全プレイヤーが最適反応をとっていて、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせ」になっていますので、ナッシュ均衡です。
この内容で使った記号たちです。
戦略型ゲームと呼びます。
プレイヤーの集合、戦略の集合、利得関数です。
これで、この記事の内容は終了です。
この記事が気に入ったらサポートをしてみませんか?