ボードゲームメカニクスのミステリー 類似ゲームの謎を追い、辿り着いたモンテカルロ法
はじめに
私はUNOZERO(ウノゼロ)というサッカーをテーマとしたボードゲームを製作しました。前回の記事にて、二人零和有限確定完全情報ゲーム(アブストラクトゲーム)として成立していることを記載しました。現在、このゲームを広めるために勝ち方を研究しています。
UNOZERO(ウノゼロ)の勝ち方について現在までに10個記事を書きました。
この勝ち方を認識しておくことで、私自身、ほぼランダムに打っていた開発当初から比べて格段に強くなりました。おそらく終盤における相手のミスを見逃さず、確実にゴールにつなげることができるようになったのだと思います。しかし、序盤、中盤における勝ち方を考え始めた頃から行き詰まりました。
類似するゲームは将棋なのか
勝ち方を考える際、参考にしていたのは将棋です。王を目指して戦法を考える将棋とゴールを目指して戦法を考えるUNOZERO(ウノゼロ)は類似しているだろうと思い、将棋の戦法について研究を続けていました。勝ち方に関するこれまで書いた記事は将棋の戦法を学んできた一つの成果だと思っています。
ただし、勝ち方⑩までの記事は主に終盤の局面に有効な内容が多く、序盤、中盤に有効な戦法については時間をかけて少しずつ解明していこうと考えていました。しかし、将棋の序盤の考え方が全く当てはまらず、中々解明が進みません。
類似するゲームに関する新たな証言
参考にすべきゲームは将棋ではないのかもしれないと思い始めた頃、友人達から衝撃の証言を得ます。
証言1 〜囲碁に近い〜
友人「将棋というか囲碁に近いよね。」
私 「え…。」
友人「相手が直前に置いたマス以外の全てのマスがずっと検討の対象になり続けるという自由度の高さは将棋というより囲碁でしょ。」
自由度が高いから囲碁に似てるとは少し雑な結論ではないかと思いつつ、序盤では大した意味をもたないと思われた矢印が後々効果を発揮するあたりは似ている気もします。謎の解明につながりかねない貴重な証言です。
証言2 〜バックギャモンに近い〜
友人「バックギャモンに近いと思う。」
私 「え…。いやいや、さすがにそれはない。このゲームは二人零和有限確定完全情報ゲーム(アブストラクトゲーム)であることは間違いない。バックギャモンのような運の要素はないよ。」
友人「ジャンルとしてはアブストラクトゲームで間違いない。ただ、相手プレイヤーの最善手はこちらにとってみればランダムとも言え、サイコロの目と同じとも言える。ランダム性を収束していくという点でゲームメカニクスはバックギャモンに近いのでは。」
私 「な、なるほど…。」
二人零和有限確定完全情報ゲーム(アブストラクトゲーム)というジャンルのゲームからヒントを得ようと思っていたので、バックギャモンという発想は全く無かったです。
序盤の勝ち方の見つけ方
このゲームの特徴として、将棋のように自分と相手の駒にわかれておらず、利用する矢印は共用のコンポーネントであり、双方でラインをつなげたり、壊したりすることとなります。将棋では序盤は守りを固めるのがセオリーと言われていますが、このゲームでは守りを固めているような余裕はありません。こちらの思惑に関係なく相手の選択次第でボールが勝手に動き始めてしまい、その対応が必要になります。そして、何とか余裕をつくり、型を作ろうと思っても、直前に動かした矢印以外は動かすことができるというルールから型を構築する途中で相手に壊されてしまいかねません。ボール近辺での攻防を繰り返しながら、同時並行でこちらに有利となる得る型を構築していく必要があります。
将棋のように序盤からセオリーとなる型を構築できない状況を、一人は自由度の高い囲碁に似ていると考え、もう一人は相手の選択のランダム性をバックギャモンに似ていると考えたのだと思います。ゲームメカニクス一つでここまで色々な発見があり、奥の深さに驚きます。
これまで将棋の戦法に名前が付いていることを真似し、発見した戦法にサッカー関連の名前をつけてきましたが、序盤の勝ち方においては名前をつけられるようなしっかりとした型を発見することは難しいと悟りました。
しかし、友人達の貴重な証言から、序盤、中盤の勝ち方を模索するためのある方法が思い浮かびました。モンテカルロ法です。
モンテカルロ法とは
詳細の説明は省きますが、例えば、下図の黄色部分の面積を求める場合に使われます。
学校で習ったような面積を求める公式は使えません。そこで、公式を使ってバッチリ答えを出すことを諦め、下記のようにランダムに点を打ち、その比率で面積の近似値を求めるというものです。点の数が多くなればなるほど精度は高まります。
このモンテカルロ法の考え方を取り入れることで強くなったのが囲碁のAIアルファ碁です。元々、囲碁はチェス、将棋と比べ、有利なのか不利なのかをどう評価して良いかわからない盤面が多く、将棋のAIよりもプログラムを組むことがずっと難しいと言われていました。結果的にAIの精度も低くなり、人間に勝つのはまだまだずっと先のことと思われていました。しかし、このモンテカルロ法の考え方をとり入れたアルファ碁が2016年に囲碁の世界チャンピオンに勝ってしまいます。
簡単に言うと、将棋のAIのように局面を評価することを諦め、ある場所に碁石を置いた後の局面について徹底的にデタラメ(ランダム)に打ち続け、その勝率に関するデータを集め、その結果論としてアルファ碁にとって有利になり得る打ち方を探索していくことで劇的に強くなっていったそうです。
興味深いのは、世界チャンピオンに勝ったアルファ碁の打ち方をプロが取り入れるようになるという現象が起きたようです。人間が発見した戦法をAIが得意の記憶力を活かして、大量に記憶しているのかと思っていたので、逆の現象が起きていることを知り驚きました。
最後に
私は開発してから3年半の間、UNOZERO(ウノゼロ)のテストプレイを続けています。ある意味モンテカルロ法を取り入れたような形で数百回のランダムなテストプレイのデータが何となく頭に残っています。これまで、戦法に名前をつけてかっこよく説明したいと思っていましたが、今後、説明しづらいけど重要と思われることについて、直感的な言葉で説明していきたいと思います。
この記事が気に入ったらサポートをしてみませんか?