見出し画像

人がAI(人工知能)に勝つ可能性を残すためのボードゲーム(アブストラクトゲーム)のルールとは

 私はUNOZERO(ウノゼロ)というサッカーをテーマとしたアブストラクトゲームを製作し、勝ち方をまとめ、公式戦のルールを様々な角度から検討しました。

 下記記事にて時間で収束する特別ルールを設けることでの時間とアブストラクトゲーム(無限ゲーム)の融合による化学反応について記載しました。実はもう一つの化学反応があります。

 公式戦ルールを検討する中で目的から少し脱線し、将棋AIについて研究しました。将棋で最強AIに勝つための可能性について仮説検証を続け、人間が最強AIに勝てる可能性を残すルールを考えました。


将棋AIについて

 将棋のAIは、近年、飛躍的に強くなり、棋士との勝負でも強さを発揮するようになります。棋士とAIが真剣勝負する将棋電王戦は「人間とコンピュータが同じルールで真剣勝負をするという歴史的役割は終わった」との理由で2017年以来開催されていません。以降AIは棋士の練習相手として活躍するようになります。
 ※AI同士の真剣勝負は今でも続いています。

将棋AIの仕組み

 AIであっても将棋の膨大(10の69乗、無量大数)な全ての局面を帰納法で解析できているわけではなく、局面の優劣を評価しながら先を探索することで最善手を模索しています。
 局面の優劣を判断するために評価値というものが用いられており、以前は人間が経験と勘をもとに評価値を算出し、手入力していました。人間が評価値を入力するため、AIの強さにはバラつきがでます。しかし、機械学習が可能となり、AI自身が評価値を調整することが可能となり、人間の手入力では不可能な超大量の評価値を微調整していくことでAIは飛躍的に強くなりました。AIの技術が更に進んだ現在では、人間がAIに勝つのはほぼ不可能と言われています。

将棋AIの弱点

 将棋におけるAIの唯一の弱点は有限な時間なのではないかと考えました。AIは時間が有限であることを本質的な部分で理解できていません。
 例えば、遅刻しそうになった時、人間は「朝食を抜く」ことを直感的に選択します。しかし、AIにはそれができません。なぜなら朝食を抜くことは最善手ではないからです。もし、朝食を抜くことを最善手にするには、残り時間に応じて朝食を抜くことの評価を柔軟に変えていく必要があります。AIにはそれができないと思われます。
 AIはどんなに強くなったとしても勝つための最善手を模索することを至上命題とされているため、残り時間と局面に応じて評価値を柔軟に変えるという選択はできないはずなんです。ここに勝機を見い出しました。
 しかし、将棋には同じ局面をループさせ続ける同一手順・局面が4回続いた場合は引き分けになるというルールがあり、時間稼ぎのループは3回までしか許容されていません。引き分けになると先手後手を入れ替え、始めから指し直しとなります。疲れ知らずのAIと違い、疲労してしまう人間にとっては相当厳しいルールです。

人がAIに勝つ可能性を残すルール

 上記のことを踏まえると、人がAIに勝つ可能性を残すためには、千日手のようなループが続いたら引き分けとなるルールを無くし、ゲームメカニクスとして無限ゲームであることを維持しつつ、時間によってのみ有限となるルールを組み入れる必要があると考えました。そこで考えたのが以下のルールです。
 ・千日手というルールを無くす(無限ゲーム化)。
 ・持ち時間のみの要素で有限ゲームとする。

 このルールでは最善手を模索することと同じくらい、時間を有効に使うことが重要となります。
そして残り時間と局面によっては時間稼ぎをし、相手の持ち時間を奪うことが最善策となる可能性があります。
 最強AIからすると詰むための最善手の評価値、時間に応じてループさせるための最善手の評価値、時間に応じてループから逃れるための最善手(本来、悪手とされる手であっても)の評価値、という3つの評価値が必要になります。しかし、残り時間や局面を考慮しながら評価値をAI自身で切り替えるのは難しいと思われ、何らかの形で人間がサポートする必要があります。サポートする人間には残り時間と局面に応じて柔軟に判断する大局観が必要になります。もし最強のAIが完成したとしてもAI任せにすることはできず、常に双方の残り時間を意識し、相手プレイヤーの戦術の変化を読み取り、限られた時間の中で場合によってはAIの示した最善手とは異なる悪手(ループから逃れるため等)を人間が選択することが必要になります。
 このルールであれば、人間と最強AIは対立することなく、タッグを組んでの共闘も可能になるのではないかと思います。人間はAIから最善手を学び、AIは人間から時間が有限であることを学ぶこととなります。(人+AI) 対 (人+AI)の真剣勝負を続けることで、人とAIが共存していくのための最適解が見つかることも期待できるのではないかと思います。

最後に

 もちろん伝統を重んじる将棋でこのルールが適用されることはないと思います。また、自作したUNOZERO(ウノゼロ)はほとんど勝ち方の研究すらされていないので、人とAIとの対戦の実現可否は議論する状況にすらありません。ただし、何らかの要素は取り入れたいと思っています。
 2023年に生まれたばかりの二人零和有限確定完全情報ゲーム(アブストラクトゲーム)であるUNOZEROだから出来る実験的な公式戦ルールを採用したいと思います。

 下記が持ち時間を計測する際に必要となるチェスクロックの無料アプリです。

参考文献
・野田俊也「ゲーム理論の裏口入門 ボードゲームで学ぶ戦略的思考法」講談社、2023年
・山本一成「人工知能はどのようにして「名人」を超えたのか?」ダイヤモンド社、2017年
・瀧澤武信、松原仁、小谷善行、鶴岡慶雅、山下宏、金子知適、保木邦仁、伊藤毅志、竹内章、篠田正人、古作登、橋本剛、コンピュータ将棋協会(監修)「人間に勝つコンピュータ将棋の作り方【あから2010を生み出したアイデアと工夫の軌跡】」技術評論社、2012年

この記事が気に入ったらサポートをしてみませんか?