見出し画像

やさしいドメモの論文 6-1 ~ 相手と自分の共有公開情報を参照するモデル ~

相手の発言を気にするとは?

一般的なプレイヤーの思考モデルをはじめ、これまでのモデルは相手の発言を気にしていないモデルでした。

ルールを無視して例えると、相手が8や20といった無意味な数字を宣言していたとしても関係ないモデルです。

一方で、このモデルは相手の発言を気にします
157といった相手の発言も加味した上で自分の持っている数字を予測するのです。

優れている点

相手が宣言した数字は、相手しか知らない情報から導き出されたものです。

相手しか知らない情報=自分にとって未知の情報

です。

相手の発言を気にすることで、自分にとって未知の情報を推測する手がかりを得られることが、このモデルの優れている点です。

相手と自分の共有公開情報を参照するモデル

具体的なモデルの説明と、新しく導入する概念である共有公開情報について記載します。

共有公開情報

ドメモにおいてプレイヤーが参照できる情報は以下になります。

  • 自分以外のプレイヤーが持っているカード

  • 場に表で置かれているカード

これらの情報をもう少し細かく考えます。

自分と特定のプレイヤー1人共通して参照できる情報を整理してみましょう。
この共通して参照できる情報は以下になります。

  • 自分と特定のプレイヤー以外のプレイヤーが持っているカード

  • 場に表で置かれているカード

自分と特定のプレイヤーの共有公開情報。

この2つの情報のことを共有公開情報と定義します。

特定のプレイヤー(プレイヤーBとする)が数字を宣言する際は、この共有公開情報と自分(プレイヤーAとする)が持っているカードを参照すると考えられます。

すなわち、プレイヤーBの発言は

プレイヤーBの発言 = 
プレイヤーAとBの共有公開情報 + プレイヤーAの持っているカード

となります。

ここでプレイヤーAにとって見れば、知りたいことはプレイヤーAの持っているカードだから

プレイヤーAの持っているカード = 
プレイヤーAとBの共有公開情報 ー プレイヤーBの発言

と表現できるでしょう。
あくまでイメージになりますが、的は得ていると想定しています。

モデルの説明

ここからはもう少し詳しくモデルを説明していきます。

共有公開情報を活用することで、自分が持っていない数字を推測できます。
推測する例を示した上で、このことをモデルの思考の流れへ反映させます。

共有公開情報の活用例

登場するのはプレイヤーAとプレイヤーBです。

プレイヤーBは共有公開情報のみを参照することで、5を宣言しました。

5は5枚しか存在しないため、共有公開情報の中に存在する枚数は5マイナス1で4枚以下ということになります(※)。

※共有公開情報の中に5枚存在している場合、プレイヤーBの手札に5はないことが明らかであり、5を宣言する必要がないため

ここで更に状況を限定して、プレイヤーBが宣言した5という数字が共有公開情報の中に4(5マイナス1)枚しかない、とします。

このとき、5と宣言したプレイヤーBの思考は次のようになります。

  1. プレイヤーAとBの共有公開情報の中には5が4枚しかない。

  2. プレイヤーAの持っているカードの中には5が存在していない

  3. プレイヤーB自身が持っているか、場に伏せているカードの中にあるかのどちらかになる。

  4. プレイヤーB自身が持っている可能性があるため、5を宣言する。

※注意点としてプレイヤーBはブラフを宣言しません。

ここで重要なのは、プレイヤーBの思考のうち2番目の「プレイヤーAの持っているカードの中には5が存在していない」です。

仮にプレイヤーAの持っているカードの中に5が存在しているとすれば、プレイヤーBは5と宣言する必要がありません。

したがって、プレイヤーAの視点から見れば

  • プレイヤーBとの間の共有公開情報に5が4枚あること

  • プレイヤーBが5と宣言したこと

これら2つで、プレイヤーAは5を持っていないことが分かるのです。


これを一般化してみると

  • 自分と特定のプレイヤーとの間の共有公開情報にある数nn-1枚あること

  • 特定のプレイヤーがnと宣言したこと

これら2つで、自分はある数nを持っていないことが分かる、と言えます。

今までの議論を使いモデルを作成します。
思考の流れは以下のようになります。

相手と自分の共有公開情報を参照するモデルが宣言する数字を選ぶ際の流れ

シミュレーションの結果

条件はこれまでと同様、ドメモを5人で10,000回プレイです。

相手と自分の共有公開情報を参照するモデル。他のプレイヤーは一般的なプレイヤーの思考モデルを使用し、本モデルは5番目に宣言を行っている。

グラフから読み取れることとしては

  • 宣言回数が5回でゲーム回数のピークが現れている

  • 宣言回数が7回・8回の場合は、一般的なプレイヤーの思考モデルと比較して大きく減少している

これら2つの特徴は共に、共有公開情報の参照という新しい概念を導入することで得られたものです。

一般的なプレイヤーの思考モデルと比較しても、ゲーム回数のうち50%が5回の宣言であがれており、かなり改善されています。

今まで自分だけの視点だったのが、5人全員の視点を活用しているわけです。

いわば死角を補うためのサイドミラーがついたような状態です。

結果・考察に対する補足

この結果は5人プレイだからという点が重要です。

プレイ人数が変われば、活用できる視点の数も変わります。
おそらく結果も変わって来るでしょう。

また、プレイする順番や相手がブラフを宣言していないという点も大切です。

このモデルは5番目にプレイしていますが、プレイする順番を変えたときにどうなるのか。
ブラフを宣言するプレイヤーがいた場合はどうなるのか。

これら2つの観点については、次回の記事で考察していきます。


この記事が気に入ったらサポートをしてみませんか?