囚人のジレンマ

囚人のジレンマとは、プリンストン大学の数学者アルバート・タッカーが講演の時に用いた一種の思考実験です。

次のような思考実験です。

二人組の銀行強盗が警察に捕まって別々の部屋で取り調べを受けている。
検察官は二人の容疑者に対して次のように迫ります。
「もし、両者とも黙秘を続ければ証拠不十分で刑期は1年。
 二人とも自白すれば刑期は5年。
 相方が黙秘を続けているとき、お前が自白すれば捜査協力の礼としてお前は無罪放免、相方は刑期10年だ」と。

このとき、二人の囚人はこのように考えるはずです。
「もし相方が黙秘する場合、自分が自白すれば無罪放免、自分も黙秘すれば刑期1年で、この場合自白した方がいい。
一方、相方が自白するのであれば、自分も自白すれば刑期は5年、自分が黙秘すれば刑期10年で、こちらの場合もやはり自白した方がいい。
つまり相方が自白しようが黙秘しようが、こちらにとってはいずれの場合でも自白が合理的だ」と。

結果的に、二人の囚人はそろって自白し、どちらも5年の刑を受けることになってしまうという話です。
利得を最大化するための合理的な戦略を採用した結果、必ずしもプレイヤー全体での利得は最大化されないという話で、専門的には非ゼロ和ゲームといいます。

この囚人のジレンマは一回きりの話ですが、人間社会では何度も「協調」と「裏切り」の選択を繰り返すことになります。
この何度も繰り返すという面を反映させて、社会における人間の意志決定へより深い示唆を与えてくれるのが、「繰り返し囚人のジレンマ」と呼ばれるゲームです。

知ってる方もいらっしゃると思いますが、この「繰り返し囚人のジレンマ」に関してはまた今度書きます。

この記事が気に入ったらサポートをしてみませんか?