見出し画像

【ゲーム理論】競合の動きを考慮した意思決定手法

今週もウェブ解析士のnoteをご覧いただきありがとうございます。
以前、戦術的なところでゲーム要素を活かす(ゲーミフィケーション)という記事を書きましたが、今回は戦略的なところで活用されるゲーム要素、「ゲーム理論」について書いてみようかなと思います。
以前の記事はこちらから

ゲーム理論とは

ゲーム理論は競争状態にある両者が意思決定を行うメカニズムを理解するための枠組みと言われています。
自分の選択した行為は相手に影響を及ぼし、影響を受けた相手の行動が自分に影響する。そういった相互作用を想定した上で戦略的意思決定を行なうために理解しておくべき理論だそうです。
この説明だけでは抽象的なので、ゲーム理論に代表される基本的な考え方をみていきましょう。

囚人のジレンマ

ゲーム理論の中で代表的なモデルが「囚人のジレンマ」です。
共同で罪を犯した容疑者Aと容疑者Bがいたとします。この二人は捕まって別々の取調室で取り調べを受けます。
容疑者が取れる行動は「黙秘」と「自白」のみ。両者とも黙秘の場合は取り調べのために長く拘束されるが、両者とも無罪になる。両者とも自白の場合は両者とも懲役5年となる。
ことを複雑にするのはここからです。司法取引による自白無罪というオプションが出てきます。片方が司法取引による自白を行なった場合、自白した側は無罪となり早々に釈放される。一方の黙秘している側は厳罰をくらい懲役10年になる。
それぞれの選択肢で導かれる結果は、以下のようになります。

パレート最適

パレート最適とは、お互いにとって不利益な状況を避け、全体の利益が最大化されている状態をさします。上記の場合、容疑者AとBはどのような行動をするのが最適だと思われますか?
まぁ、考えるまでもなく、両者が無罪放免となる「黙秘を続ける」がこのケースのパレート最適です。しかし、両者が合理的に考えて動くとそうはならないというのが囚人のジレンマの面白いところです。
どういうことか見ていきましょう。

ナッシュ均衡

ナッシュ均衡とは、2人以上のプレイヤーがお互いの行動を予測しながら行動する場合における均衡点のことを指します。合理的に、相手の行動を予測しながら自分の身の振り方を考えると、上記のケースではこのナッシュ均衡が生じます。
容疑者Aの立場になって考えてみましょう。取り調べを受けている最中の関心ごとは容疑者Bの行動です。「Bの野郎は、果たして黙秘を続けているのだろうか」と不安になります。もし、Bが黙秘を続けていた場合はどう行動するのがベストでしょうか。この場合、Aは黙秘を続けても、自白しても無罪が確定します。あとは、早々に釈放されるか否か。となれば早く釈放された方が良いと考えるのが合理的です。そう、Bが黙秘している場合は自白するのがAにとっての最善手になるわけですね。
ではBが自白してしまった場合はどうでしょう。もし黙秘を続ければ懲役10年となり、白状すれば有罪にはなるものの懲役は5年と、10年に比べて短い懲役で済むことになります。あれ?この場合も自白することが最善手ということになりますね。
Bがどのような行動を取るにしてもAにとっては「自白」が最善手になる=Aにとっての支配戦略になるということです。これは、全く同様のことがBにも言えるわけですから、お互い「自白」を選んで両者懲役5年に甘んじることになります。
このように相手の行動に依存して均衡点に落ち着くのがナッシュ均衡です。囚人のジレンマは先に紹介したパレート最適と、このナッシュ均衡の間で生じる矛盾を指しています。

他者依存は弱者が勝つ可能性もある?

上記のように、ゲーム理論上では、自分の行動が相手の行動に影響を与え結果として自分に返ってくると言った相互依存関係が強く働きます。この相互依存関係は、弱者にも勝機を生むことがあるのだそうです。以下の例はスタンフォード大学のジョン・マクミラン教授が示した例です。

畜舎に大きな豚と小さな豚がそれぞれ1匹ずつ、合計2匹います。
どちらの豚も知性があるとしましょう。
畜舎から離れた場所に1日1回だけ餌を出してくれる装置のボタンがあり、装置の本体は畜舎に設置されています。
先の囚人のジレンマの例のように考えると、両者に提示される選択肢は「ボタンを押す」「ボタンを押さない」の2択です。
ボタンを押したときに出てくる餌の総量を10として、大きい豚は10食べて満腹、小さい豚は6食べて満腹です。

上記の条件の中で、利得を数値としやすいように、豚のHPを考えてみましょう。餌を食べた量=獲得できるHPとして、ボタンを押して畜舎に戻ってくるまでに消費されるHPは3で固定されると仮定します。
ここで弱者である小さい豚の視点からHPを整理してみましょう。
大きい豚と共にボタンを押しに行くと、体格差で押し退けられて畜舎に着く頃には全て食べられてしまう。小さな豚だけで押しに行っても戻るまでに全て食べられてしまう。「押す」という選択をした場合、大きな豚が押すにせよ、押さないにせよ収穫は0なうえ、移動にHPを3消費するので獲得HPは-3になる。
では「押さない」を選択した場合は?
大きな豚が押す場合、戻ってくるまでに満腹まで食べられるのでHPは+6。大きな豚も押さない場合は±0になりますね。
さぁ、どうでしょう。「押す」選択の場合はHPは-3、「押さない」場合は+6か0。この場合小さい豚の支配戦略は「押さない」になるのです。

そうなると、大きい豚が取れる選択はボタンを押しに行ってHPを3消費しながら4相当の餌を食べるか、共にボタンを押さずに痛みわけで0を選ぶかしかありません。
押す場合=-3+4=+1、押さない場合=0な訳ですから、プラスになる「押す」を選択するのが合理的ですね。
結果を見れば、弱者であるはずの小さい豚がHP6増やすのに対して、強者であるはずの大きい豚は1しかHPを増やすことができません。

まとめ

ゲーム理論は、意思決定を行う際に、自分の行動が相手に影響をお及ぼし、相手の行動が自分に及ぼすということを認識するための枠組みです。自社理解と競合理解から最善の一手を見つけるためにとても役に立ちそうですね。3C分析の重要性を改めて理解することができます。

囚人のジレンマは代表的なモデルであり、合理的に動くと、全体最適とは違うところに着地してしまうというモデルです。価格競争に陥るメカニズムとして用いられたりしますよね。
囚人のジレンマから抜け出すための手法に「談合」「カルテル」なるものがありますが、独占禁止法に触れるためこれらの手を取ることはできません。

ゲームを有効に進めるために、「先手を打つ戦略」や「後追い戦略」などがありますが、事例共有すると文字数がかなりの量になりそうなので、気になる方は日本経済新聞出版社から出ている伊藤元重氏の『ビジネス・エコノミクス』をご一読ください。

あとがき

今週も最後までお付き合いいただきありがとうございました。
ゲーム理論面白いですよね。「中の人」が初めてゲーム理論を知ったのは以前勤めていた会社で受けたマネジメント研修でした。そこでは、制限時間内に限られた球数で隠された的に射撃して得点を競うという戦略実行とチームマネジメントをシュミレートするゲームを行いました。そこでは、「中の人」は制限時間一杯まで動かずに、他のチームが見つけた高得点の的に集中砲火するという戦略(後追い戦略)をとったわけですが、他のチームから見ればそこそこ奇策に映ったようです。「中の人」のチームの動きを警戒した他のチームもなかなか動かずに、なんとも盛り上がらないゲームになってしまいました。(笑)
結果としてゲームには勝利することができたものの、自分のとった戦略が競合の戦略にも影響を及ぼすということを身をもって体験した実りのある研修でしたね。
と言ったように、自社の戦略は自社のことだけ考えていてもダメなんだよねというのが、この記事で伝えたいことでした。

この記事で52週、つまり1年連続投稿です \イェーイ/
あの、「一緒にnote書いてみたい」って方、声かけてください。(笑)ウェブ解析士協会の正会員の方、少しでも興味あれば是非に。
あと、お題の提供もお待ちしておりますね。

なんだかあとがきが長くなってしまいましたが、この辺で。
また来週お会いしましょう。


この記事が気に入ったらサポートをしてみませんか?