【日本語訳】PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models

2024年2月6日 20:48

概要（abstract）

我々は、戦術的なバトルゲームにおいて人間並みのパフォーマンスを達成した初のLLM（大規模言語モデル）搭載エージェント、「ポケLLモン」を紹介します。これは、ポケモンバトルで示されています。ポケLLモンの設計は三つの鍵となる戦略を取り入れています。

バトルから得られたテキストベースのフィードバックを即時に活用し、ポリシー（方針）を反復的に洗練させる。

外部知識を取得して幻覚を防ぎ、エージェントがタイムリーかつ適切に行動できるようにする。

エージェントが強力な対戦相手に直面し、戦いを避けたいと思ったときに発生する「パニックスイッチング」現象を軽減する。

オンラインバトルでの人間との対戦は、ポケLLモンが人間らしいバトル戦略とタイミング良い意思決定を行うことを示しています。これにより、ラダーコンペティションでは勝率49％、招待バトルでは勝率56％を達成しています。

実装とプレイ可能なバトルログは、以下のURLで利用可能です