ゲーム理論の簡単な説明から、世界平和が可能な理由を考える 前編
世界平和というと、高尚な理想に基づく自己の利益を超越した固い信念によって、その努力がなされるものだという一般的なイメージがあるかと思います。
しかし、そのイメージとは裏腹に、実際には、信念もなく自己の利益を優先するような人間にこそ、世界平和は可能になるのだということを、簡単なゲーム理論からみていきたいと思います。
まず、ゲーム理論における囚人のジレンマとナッシュ均衡の基本的な考え方です(ご存知の方は読み飛ばし推奨です。目次の「囚人ゲームの誤解」に飛んでください)
ゲーム理論とは
経済活動において、人間がどうやって意思決定を行うかを「駆け引き」という観点から数学的にモデル化したことから発展してきた学問分野です。
囚人ゲームとは
ある犯罪で捕まった二人の囚人(AとB)が別々の部屋で取り調べを受ける。
〇ルール1
もし片方が自白し、片方が黙秘した場合、自白した方は司法取引により無罪・黙秘した方は懲役10年
〇ルール2
二人とも黙秘した場合は証拠不十分のため懲役2年
〇ルール3
二人とも自白した場合、懲役5年
この時、各プレイヤーの利得は以下のようになります。
ナッシュ均衡とは
ナッシュ均衡とは、映画「ビューティフルライフ」の主人公にもなった数学者ジョン・ナッシュが定式化した概念で、「プレイヤーが最適な選択をとりあっている状況」のことを指します。
もう一度、上の図を用いて説明してみましょう。
プレイヤーAはプレイヤーBが黙秘を選択する時、黙秘を選択すれば懲役2年、自白を選択すれば無罪となります。つまりプレイヤーAの利得は「黙秘<自白」だといえます。
さらにプレイヤーAはプレイヤーBが自白を選択する時、黙秘を選択すれば懲役10年、自白を選択すれば懲役5年となります。ここでもプレイヤーAの利得は「黙秘<自白」になります。
つまり、プレイヤーAはプレイヤーBがどのような選択をするかに関わらず、「自白」するのが高い利得を得られる鉄板戦略ということになります。
しかし、上図にあるように、これはプレイヤーBにとっても同様であるため、プレイヤーAとBは両者ともに「自白」を選択することになります。さらに、この状況下において、プレイヤーが、「やっぱり協力して黙秘するのが得だ」と気付いたとしても、自分だけ黙秘に変更したところで、懲役が10年に延びるだけであることが明らかなため、戦略の変更ができません。このように互いの戦略が合理的に安定した状況を「ナッシュ均衡」といいます。
プレイヤーAとBが自己のインセンティブを追求した結果、互いの合理的判断が重なる「自白・自白」(図の黄色網掛け部)がナッシュ均衡となる。
囚人ゲームの誤解
「誤解」というと、大仰な言い方ですが、なんとなく見落とされやすい前提として、私たちの大半はそもそも犯罪者ではありません。おそらく、これを読んでいる方もインターネットができる環境にあるということは犯罪者ではないのだと思われます。
そうなると、犯罪者ではない我々一般市民の立場からすれば、悪いことをして秩序を乱すような不逞の徒は刑務所に収監され、できるだけ社会から切り離されておいて欲しいと思うのが人情でしょう。
囚人ゲームにおいて、ゲームルールの設計者は犯罪者たちに司法取引という選択肢を与えることで、拷問や自白剤といったコストをかけることなく自白を引き出します。これは犯罪者が社会性の高い人物だからではなく、むしろその逆で、犯罪者が自分の利益のことしか考えない利己的な人間であることが、かえって社会的に望ましい結果を生みます。
このように、プレイヤーが利己的に行動した結果、社会的に望ましくなるようなインセンティブ構造のことを、筆者は「仕組み(あるいは制度)」と定義しています。
囚人ゲームでいえば、「犯罪者に司法取引を持ち掛ける」というのは、囚人を適切に刑務所に収監するという社会的効用の観点からは、「優れた仕組み」だといえるでしょう。
世界平和の仕組み
ちなみに世界平和を実現する仕組みというのは、数百年前には既に理論化されています。
全世界的に国際的な連合を組織し、ある国が他国を侵略するようなことがあれば、残りの国でその侵略国を制裁するという仕組みがそれです。このような考え方は、いわゆる「集団安全保障」として知られています。(ちなみに「集団安全保障」は、NATO(北大西洋条約機構)のような複数国家による軍事同盟である「集団防衛」や、日本でよく取り沙汰される「集団的自衛権」とは異なる概念です。)
プレイヤーは侵略の意図を放棄すれば、利益もないかわり損失もない現状維持(±0)となるが、侵略をすれば自国を除く全世界の武力制裁によって確実な被害(-50)を受ける。
非常にシンプルな仕組みです。
ところが、この集団安全保障という考え方は、人類史のなかでは何回か実践されており、そのいずれも上手く機能しませんでした。その取り組みの最大なものの二つが、第一次世界大戦後の「国際連盟」と、第二次世界大戦後の「国際連合」になります。
これらが機能不全を起こした理由として、各国は国際的な協調行動をとることよりも、自国の国益を追求することにインセンティブを感じるためだというのが、その説明として、よくなされます。つまり、集団安全保障というのは囚人のジレンマと同様に、「協調するのが望ましいけれど、各国がインセンティブを追求した結果、裏切り戦略がナッシュ均衡となる」というわけです。
しかし、筆者は別の見解を持ちます。なぜなら、「国際連盟」も「国際連合」も設立された当初、人類は生産性が低く「食えない時代」だったからです。当時の状況を、もし地球が100人の村だったとして表現するならば、100人のうち100人が朝から晩まで働いて、50人分のお米しか収穫できないような――厳密には正確ではないものの、極端にわかりやすくいえば――そういう時代だったといえます。
では、50人分の米しか収穫できないとして、残りの50人はどうするのでしょうか?
残念ながら飢え死にします。
もし餓死が嫌ならば、食料を割り当てられた誰かを狙って、暴力で食料を奪い取るしかありません。
第二次世界大戦終結当時というのは、文明史観的には啓蒙思想が浸透し、人権のような進歩的な思想が主流となったことで、表向きには戦争が忌避されていたかにみえます。しかし、そのキレイゴトの皮をめくった人類史的な非常にドライな死生観のところでは、生存権を巡った熾烈な生存競争が繰り広げられており、その意味において戦争は、資源にあぶれた余剰人口を兵士として他国に送り込み、あわよくば新しい資源が手に入れられるという、非常にインセンティブの高い戦略行動だったといえます。
そのため、当時の利得表は下図のようなものだったのではないかと予想されます。このようなインセンティブ構造において、国際的な協調を行うのが不可能なのは自明でしょう。
かつての戦争は、過剰な人口を調節し、より強い個体に資源を配分するための仕組みとして有用なものであった。そのため、各国は苦労して国際協調を成し遂げたとしても、国内における飢饉や金融危機などの政情不安を引き起こし、かえって戦争状態よりも利得が低く(5→-5)なる。
しかし、現代は生産性があがり世界中の人間が「食える時代」になりつつあります。地球が100人の村だったとしたら、100人のうち10人が働けば、100人分のお米が収穫でき、その余剰生産に支えられて、残りの90人はスマホを作ったり、ユーチューバーになったり、株の配当だけで飯が食える時代です。このような環境下では当然インセンティブ構造も変化していくと思われます。より実態に即していえば、現代においては戦争のインセンティブが低下しており、集団安全保障の利得表はふたつのナッシュ均衡をとることになるのではないかと考えます。
すなわち、国際的な協調に参加する国が世界の軍事力の51%を超えるようであるならば、国際協調に対抗できる国は存在しなくなるため、ナッシュ均衡は「協調」となり、それ未満にとどまるならば「戦争」がナッシュ均衡となります。(おそらくそうだと思いますが、ゲーム理論に詳しい人、もし誤りがあれば指摘してくださると助かります)
プレイヤーにとって、戦争のコストが利益を上回るようになったため、国際協調にインセンティブが生まれる。理論的には、国際協調への参加国の軍事力が51%を超えると、「国際協調」がナッシュ均衡となる。
人間には「学習性無力感」というものがあり、一度失敗したことはこれからも不可能だと考える性質があるようです。
かつて失敗した取り組みであっても、技術の発展や生産性の向上により、インセンティブ構造が変化すれば、実現可能になっているかもしれません。そのため、世界平和を絶対不可能だと考えるのではなく、しつこく挑戦していけば、そのうち条件がハマった時に、すんなりと上手くいくのではないかというのが、筆者の基本的な考え方になります。
なお、集団安全保障というのは、理念的には「悪い国を皆でやっつける」ための仕組みというよりは、「強い国が好き勝手できないよう弱い国で結集する」という考え方が、むしろ本質です。なので、既存の国際秩序である集団防衛の延長線上からは、かえって実現しにくいしのではないかと考えています。
書いているうちに、インセンティブ構造からみる右派と左派の役割について、補足的にもうちょっと書きたいことができたので、後半に続きます。
↓は筆者による、世界平和を実現するために必要な実践を考えるマガジンです。
この記事が気に入ったらサポートをしてみませんか?