見出し画像

著者が語る:『東大生の論理』における「アヒルと餌のナッシュ均衡」!

『東大生の論理――「理性」をめぐる教室』(ちくま新書) については、2010年12月に上梓して以来、多くの読者から、さまざまな書評やコメントをいただき、大変ありがたく思っている。

いくつかの大学の講義のテキストや副読本として使用されているためか、今でも時折尋ねられるのが、次の「アヒルの実験」に関連する質問である。

アヒルの実験

2009年度前期、私が東京大学教養課程で担当した「記号論理学」第5回講義では、論理学とゲーム理論の関係を検討して、次のエピソードに触れた。 

 1979年、ケンブリッジ大学の生物学者ディヴィッド・ハーパーは、大学の植物園の池に住むアヒルに餌を投げているうちに、興味深い実験を思いついた。彼と助手は、池を挟んで二手に分かれて、まったく同じ大きさに切り分けたパンを池に投げた。ただし、ハーパーは5秒に1切れ、助手は10秒に1切れを正確に投げ入れたのである。
 さて、もし読者がお腹をすかせたアヒルだとしたら、どちらの人間に接近するだろうか? もちろん、5秒おきにパンの投げられる場所に行く方が、より多くの餌にありつけそうだが、他のアヒルも同じように考えて同じ場所に集まってくれば、混雑して餌の奪い合いになる可能性も高い。それならば、10秒おきにパンの投げられる場所でゆったりと食べる方がよさそうだが、他のアヒルも同じように考えたら、むしろこちらの方が混雑するかもしれない。どちらへ行けばよいのだろうか?
 この状況をゲーム理論に当てはめると、すべてのアヒルが餌を最大限食べられるような状態がナッシュ均衡となる。実際に計算してみると、この状況のナッシュ均衡は、5秒おきに投げられる場所に3分の2、10秒おきに投げられる場所に3分の1のアヒルが集まる場合となることがわかる。
 さて、現実のハーパーの実験結果は、驚くべきものだった。餌を投げ入れ始めて約1分後、アヒルたちは、5秒おきに投げられる場所に22匹、10秒おきに投げられる場所に11匹が集まったのである。まるでアヒルたちは、ナッシュ均衡を知っているかのように、きれいに3分の2と3分の1に分かれたのである!
 そこでハーパーは、もっと実験を複雑なものにした。今度はパンのサイズを変えて、投げられるパンの総量と投げられる速度の組み合わせを統合した結果が2対1の割合になるように調整した。その結果、こちらの複雑な実験では数分間かかったが、やはりアヒルたちは、ナッシュ均衡の割合どおりに分かれて餌を食べたのである!
 そもそもゲーム理論は、人間がどのようにすれば利得を最大にできるか、いかなる戦略の可能性があるのか、どの選択が「理性的」なのかを研究するために生まれた分野だった。ところが、実は、ゲーム理論は生物学や進化論に関わる多彩な問題にも深く関係し、今では自然科学全体に影響を及ぼす可能性さえ示唆されているのである。

東大生の自主レポート

学期が終わりに近づいてくると、多くの東大生が自主的にレポートを仕上げて持ってきた。なかでも傑作だったのが、次のレポートである。

 この日に東大生が持ってきたレポートは、「アヒルの餌とナッシュ均衡」という題名だった。彼は、第5回講義に出てきたアヒルの話に触発されて、次のようなアルゴリズムを作成した。
 このアルゴリズムの満たす条件とは、①池Aと池Bに分けて、池Aには5秒に1回、池Bには10秒に1回同じ量の餌を投げ入れる、②アヒルは60匹とする、③餌を投げ入れる時間は60分とする、④アヒルには個体差があり、2匹のアヒルが同じ餌にぶつかる場合、餌を取るのが上手なアヒルが取る、⑤餌を取るのが上手か下手かの個体差は、正規分布にしたがうものとする、⑤アヒルはランダムに餌に接近するが、もし5分間同じ場所にいて餌を食べられなければ、池を移動する、というものである。
 さらに彼は、このアルゴリズムを「C++」言語のプログラムに書いて、実際にコンピュータで実行してみたのである! その5回分の実行結果が添付されているので見てみると、60分後の池Aと池Bのアヒルの割合は、「34・26」、「37・23」、「38・22」、「33・27」、「39・21」となっていて、平均値はおよそ「36・24」で3対2になっている。この結果は、ハーパーの実験とは条件が異なるため比率も異なっているが、ここで重要なのは、理系の1年生がシミュレーション・プログラムを書いてコンピュータに実行させたという点である。

最近はプログラミングが流行ってきているためか、この「シミュレーション・プログラム」がどんなものか見たい、と時折尋ねられるわけである。

「アヒルの餌とナッシュ均衡」

さて、久し振りに、このプログラムの制作者に連絡を取ってみた。彼は、立派に東大を卒業後、同大学大学院のコンピュータ科学専攻で修士課程を修了し、現在は機械学習系のベンチャー企業でエンジニアになっている。

プロフェッショナルとなった彼からすれば「今見返すとあまりに不出来なプログラム・文章」ということで、恥ずかしいらしい。これが「プログラムの勉強を初めて1・2ヶ月目時点での拙作」であり「正規分布の実装など、かなり不正確な部分がある」ことを踏まえてならば、公開してもよいという許可を得た。それが次のPDFファイルである(氏名等は黒塗りにしてある)。

製作者は謙虚だが、プログラムの完成度などは別として、当時の大学1年生の段階で、講義に触発されて、その内容をシミュレートするプログラムを書いて実行させたという発想そのものが、抜群なのである!

 この日の東大生のコメントには、次のようなものがあった。「無作為に大量のサンプルを選ぶと統計学的には正規分布するように、集団の中には必ず強欲な人と謙虚な人がいる。その割合は不思議なことにいくらやっても変わらないというのは、アヒルの例からも明らかである。僕らは個人のレベルでは頭をフルに働かせ、合理的な判断をしているように見えても、生物としての種の一員としてみれば、何か見えないダイナミクスに操られて動いているだけではないのかと、少し恐怖を覚えた。この講義の後、僕はラーメンを食べるつもりだが、これは僕の意志で本当に行っているのか???」
 ここで、授業で行ったゲームやアヒルの実験の話から「何か見えないダイナミクス」を想像する東大生のセンスが、非常に重要なのである。というのも、ハーパーがアヒルの餌からナッシュ均衡を思い浮かべたような発見の背景には、偏狭な視野にとどまらず「想像力が豊かで発想を転換できる」ことが必要不可欠だからである。
 「この講義の後、僕はラーメンを食べるつもりだが、これは僕の意志で本当に行っているのか」という疑問に至っては、まさに「自由意志」に関わる哲学の根本問題である。理系の一年生が、このような疑問に到達できただけでも、すばらしいセンスなのではないだろうか……。

#エッセイ #コラム #読書 #推薦図書 #思考力 #高橋昌一郎 #ちくま新書 #東大生の論理 #記号論理学 #アヒルの実験 #ナッシュ均衡 #プログラミング

この記事が参加している募集

#推薦図書

42,649件

Thank you very much for your understanding and cooperation !!!