見出し画像

ポケモンバトルAI Pokémon Battle Scopeについて



0. はじめに

 先日、ポケモンの公式から2/25に行われる「ポケモン竜王戦2024」にHELOZ株式会社様が開発したポケモンバトルの形勢判断AI「Pokémon Battle Scope」(以下PBS)が発表されました。それについて現時点で分かる情報(といっても画像1枚くらいしかありませんが)からどんなものか予想してみたいと思います。あとで追加の情報が来た際に、答え合わせもしようと思います。
※ 予想や想像が多く含まれ、頓珍漢なことも書いていると思うのでご注意ください

1. 将棋AI

  PBSを開発したHELOZ株式会社はもともと将棋AIを開発している会社です。最近の囲碁や将棋の中継では、下の画像のように「現盤面で先手後手どちらが有利か」「最善手は何か」をAIが判断した結果が表示されていることが多いです。

図1 形勢判断
 図2 候補手

 対局中の囲碁や将棋の盤面は非常に難解で素人はなかなか楽しめません。そういった詳しくない方でも楽しめるようにしたり、解説者が解説する際の参考にしたりするために導入されました。画像の状況は、先手が52%後手が48%のほぼ互角、最善手は「2五桂」(ただし「1三歩成」等でもあまり変わらない)であることを示しています。一般にどちらかが60%になった局面でのコンピュータ同士の対局ではまず逆転は起こりえません。またこの%の数値のことを評価値とよびます。
(ただし先日の棋王戦第一局では例外的なことが起こりました)

2. ポケモンと将棋の違い

 ポケモンと将棋は大きく異なるゲームです。将棋はじゃんけんのような運要素が全くないゲームに対し、ポケモンは様々な運要素が作用するゲームです。運要素がないということは、理論上全ての局面に対し必ず「最善手」が存在してお互いが「最善手」を指した場合は先手必勝か後手必勝か引き分けか決まります。(二人零和有限確定完全情報ゲームといいます)
将棋では基本的に、AIの評価値70%や60%の手を続ければいずれ勝利します。評価値の大小はだいたい決着までの手数に相当し、値が大きいほうが短い手数で決着します。
 対してポケモンは様々な不確定情報と運要素が作用し、絶対的な「最善手」は存在しない場面がほとんどです。例えば以下の2つの場面を考えてみます。SV対戦環境の主人公2体です。

図3. ハバタクカミとカイリュー

ハバタクカミ VS カイリュー

両者ポケモンはラスト1体で、それぞれ分かっている情報は下記の通りとします。視点は観戦者視点で考えます。
ハバタクカミ
技: ムーンフォース/電磁波/不明/不明
性格: 不明
特性: こだいかっせい
もちもの: ブーストエナジー
努力値: 不明
能力ランク変化: こだいかっせいのS上昇あり
テラスタル: 別のポケモン使用済み
残りHP: 6割
カイリュー
技: じしん/はねやすめ/不明/不明
性格: 不明
特性: 不明
もちもの: たべのこし
努力値: 不明
能力ランク変化: なし
テラスタル: 別のポケモン使用済み

場面1.  カイリュー残りHP半分

 まずカイリューの残りHPが半分の時を考えます。この場合、ハバタクカミ側には絶対的な最善手「ムーンフォース」が存在します。双方どんな型であっても「ムーンフォース」で倒して勝利できるからです。(ちなみに持ち物が不明でロゼルやチョッキだと努力値次第で耐えられる)
AIの評価値風に表記するとこんな感じでしょうか?
形勢: ハバタクカミ側(100%): カイリュー側(0%)
ハバタクカミ側候補手: ムーンフォース(100%)、その他(0%)
カイリュー側候補手: 全ての行動(0%)

場面2.  カイリュー残りHP8割

 次にカイリューの残りHPが8割の時を考えます。この場合も「ムーンフォース」でいい場面がほとんどですが、カイリューの努力値次第では耐えられて「アイアンヘッド」や「電磁波」等で逆転される可能性が出てきます。つまり「ムーンフォース」を選ぶのは誤りで「電磁波」で痺れさせるしか勝つ方法がないことになります。
先ほどと同じようにAIの評価値風に表記するとこんな感じでしょうか?
(数値はこじつけです)
形勢: ハバタクカミ側(95%): カイリュー側(5%)
ハバタクカミ側候補手: ムーンフォース(95%)、電磁波(5%)、その他(0%)
カイリュー側候補手: 電磁波(50%)、アイアンヘッド(20%)、その他(30%)
※ たべのこしカイリューは「アイアンヘッド」よりも「電磁波」持ちが多いと思いこんな感じにしました。(正しいかは分かりせん)

 つまり言いたいこととしては、将棋ではAI評価値90%の手を選び続ければ確実に勝ちますが、ポケモンではそうではない(10戦に1戦くらいは負けることがある)ということです。

3. Pokémon Battle Scope(PBS)

 やっと本題PBSに入ります。既に公開されている情報と自分の予想からこんな感じのものかなと思います。

図4 Pokémon Battle Scope

画像からわかること

ハルト側選出: ハバタクカミ(瀕死)/ラティオス(対面)/不明
アオイ側選出: ママンボウ(瀕死、竜テラス)/ハバタクカミ(対面)/不明

PBS予想

ポケモン竜王戦ルールに特化したAI
② 観戦者視点での形勢判断

 まず①ですが、AIは決められたルールに対し時間をかけて学習し精度を向上させていきます。今回の竜王戦本戦は竜テラス選出必須など特殊ルールで行われるため、通常のランクマッチとは異なる立ち回りが要求されることがあります。当然通常ルールで学習したAIでは形勢判断の精度が落ちるため、今回の大会用のAIを用意しているのではと思います。
 次に②は、3対3の竜王戦においてハルト側は既に瀕死のハバタクカミを除くと交換先は1体しかいません。その状況で候補手にカイリュー交換とアシレーヌ交換があるため、恐らく3体目の選出が分からない観戦者視点の判断かと思われます。
 さらに大会は連戦になるため、だんだんとポケモンの型等の情報が集まってきます。そういった情報もAIの予想に反映されるのか気になります。

AIの候補手の解釈

 基本的にAIは候補手の意味を説明してくれません。上の図で言えばどうしてアオイ側の最善手が「シャドーボール」なのかは、自分たちで考えなければいけません。試しに図の形勢判断に対し、自分なりに解釈してみました。

アオイ側は対面有利(87%)でハッサム引きやテラス読みの余裕がある
② ハッサム引きやテラスタルに対する安定行動のシャドボ(50%)マジフレ(27%)を推奨
ハルト側は劣勢(13%)で相手の予想通りのハッサム交換(22%未満)は危険
ラティオス居座り(35%)カイリュー交換(22%)+テラスで逆転を狙え

 これが正しいかは分かりませんが、今度の竜王戦のライブ配信では将棋中継のように解説者にAIの候補手の解説が求められる場面を見れるかもしれません。

4. 懸念点/注意点

 現在自分が感じた懸念点や注意点をまとめておきます。一部は今回の竜王戦に関係なく、また実際は杞憂に終わるかもしれません。

懸念点

  • AIとポケモン双方の理解がないと候補手の解説が困難でむしろ解説者や視聴者を混乱させる可能性がある

  • ルールが変わるたびにそれに対応したAIを用意する必要がある    (基本的に将棋は持ち時間が変わるだけでルールはすべて同じ)

  • 複数回対戦が行われる場合、過去の対戦の内容はきちんと反映されるのか    (反映されないと大きく精度が損なわれる恐れあり)

  • ポケモンバトルは流行が逐一変化する(メタが回る)ため、AIがそれに適応できているか不明(100%の対応を恐らく不可能)

注意点

  • 評価値80%以上のAIの最善手を選んでも必ず勝つわけではないので将棋AIの感覚では見てはいけない

5. おわりに

 自分はポケモンもAIもどちらも好きなので、今回のニュースはとても驚きわくわくしました。他にも今週は、大規模言語モデル(LLM)を用いたAIにポケモンバトルをさせる研究が発表されるなど非常に衝撃的な一週間でした。2週間後の竜王戦を楽しみに待ちたいと思います。ここまで長々と読んでいただき、ありがとうございました。


この記事が気に入ったらサポートをしてみませんか?