汎用人工知能(AGI)とノベルゲームとTRPG

ノベルゲームについて

 皆さんはノベルゲームを知っていますか?
ノベルゲームは、主にテキストを通じてストーリーやキャラクターのやり取りを楽しむタイプのゲームです。
絵や音楽のような要素もあることが多いため、ビジュアルノベルとも呼ばれることがあります。

 プレイヤーは、物語を進めながら選択肢を選び、それによってストーリーが分岐したり、エンディングが変わったりします。
この点で本に書かれた物語とは異なります。選択肢という概念は読者兼プレイヤーによって、どのような選択をするのかを選べるのでインタラクティブであるがゆえに、自分が物語の主人公になったような気分を味わえます。

 しかし、ノベルゲームにも選べる選択肢には限りがあります。それは製作者が提示した選択肢の中でしか選べないからです。
これは中々歯がゆいことです。自分の考えが提示された選択肢の中にない場合もありますし、それ以上にどう転んでも制作者の手のひらの上、予想の範疇で遊んでいるというおままごと感がぬぐえません。

 では、無限の選択肢をプレイヤーが選べるゲームは存在しないのか?実は存在します。テーブルトークRPG(TRPG)というジャンルの遊びがあります。TRPGを知らない人に向けていかに軽く説明します。

TRPG(テーブルトークRPG)とは


 TRPG(テーブルトークRPG)は、参加者が架空のキャラクターになりきって物語を共に創り上げる、協力型のゲームです。TRPGは主に、プレイヤー、プレイヤーキャラクター(PC)、ゲームマスター(GM)の3つの要素で構成されています。

  1. プレイヤー: 参加者であり、それぞれ架空のキャラクター(プレイヤーキャラクター)を演じます。役割やスキルが異なるキャラクターを選び、物語を進める上で重要な決定を行います。

  2. プレイヤーキャラクター(PC): プレイヤーが演じる架空のキャラクターで、ゲームの世界で冒険を行います。キャラクターには、属性やスキル、特徴などが設定されており、プレイヤーはこれらを活用して物語に関与します。

  3. ゲームマスター(GM): TRPGの進行役であり、物語の舞台設定やストーリー展開を担当します。GMは、プレイヤーが遭遇する敵や味方、さまざまな状況を設定し、プレイヤーの選択に応じて物語を展開させます。また、ルールの適用や課題の提示、判断を行い、ゲームをスムーズに進める役割も担っています。

 TRPGのプレイ方法は、まずプレイヤーがキャラクターを作成し、GMが物語の舞台や目的を提示します。次に、プレイヤーはキャラクターを演じながら冒険を進め、途中で出会う様々な人物や出来事に対して選択や行動を行います。これらの選択肢は、物語の結末やキャラクターの成長に影響を与えます。



ノベルゲームとTRPGの違い

 ここまで読んでくださった方はもしかしたらお気づきかもしれませんが、TRPGはノベルゲームの限られた選択肢という欠点を人力によって克服しています。ゲームマスターとプレイヤーの想像力を合わせることで、無限の選択肢が存在し、話の結末の可能性も様々なものとなります。TRPGに魅了されたファンがいるのはこれが理由でもあります。
 また、TRPGでは言葉による表現だけではなく、画像や音楽をリアルタイムでGM側が選択して表示することで、世界観や雰囲気をもっと具体的にイメージさせやすくすることもできます。

TRPGとAGI(汎用人工知能)

 なぜ、TRPGはこのように自由にあふれているのか、それはGMやプレイヤーが人間だからです。ここで当たり前なことを言います。人間は汎用天然知能です。自然界が生み出した奇跡の存在です。人間は汎用知能であるからこそ、臨機応変にその場で新たな展開を生み出すことができます。この点において、人間はコンピューターに勝っていたということができます。コンピューターは未定義のものを生成して新たに定義し直すことはできなかったからです。

 しかし、大規模言語モデル(LLM)によって、コンピューターにも汎用知能を見出すことが現実的になりつつあります。これはGPT-4で遊んでみたことのある方なら納得できるかと思います。
 これは、AGI(汎用人工知能)の芽生えです。

 ChatGPTなどをめぐっての活用方法はTwitter上で様々なものが流れてくるかと思いますが、個人的な興味は上で述べてきたようなノベルゲームやTRPGといった、インタラクティブな物語にあるのでそれに対するAGIの応用について考えたいと思います。

 とはいっても、最初に述べることはシンプルです。TRPGの自由度を人間という汎用天然知能によって実現していたのと同様に、ノベルゲームやTRPG的なものを汎用人工知能(AGI)によっても実現することは可能なのではないかということです。

 知る限りでも既に『AI Dungeon』のようなものがあります。 

 現段階では、LLMによるGM(ゲームマスター)は想像力に欠けていて、ありきたりな展開しか提示してくれないかもしれませんが、バイアスやファインチューニングによって好ましい偏り(テイスト)を生成させることも可能です。(これはChatGPTで頑張れば実現することが可能です。ぜひためしてみてください。その方法については機会があれば紹介します。)


 これだけでは想像力に自信のないプレイヤーには、言葉だけで物語を展開していくというのはハードルが高いかもしれません。人間というのは思った以上に文章が読めない生き物です。
 そもそも皆さんが想像するゲームというのは、2Dであったとしてもグラフィックやオーディオが付属しているものです。これも画像生成AIや音楽生成AIによってリアルタイムに生成することができます。ひとまずAIを用いたゲーム開発者が取り組むであろう分野はこのあたりでしょう。

AGIと仮想世界とマルチモーダル

 
 しかし、これでも不便です。なぜなら自分の行動や選択をいちいち文字に書き起こさないといけないからです。言語化も人によって得手不得手があります。
 我々は現実世界で、どのようにインタラクティブに世界や人間とつながっているか。それは文字だけではなく、声によって紡がれた言葉、身振り手振りなどの非言語的コミュニケーション、それらを時系列上につなげて意味を見出した”言動”、これらによって人は世界と対話しています。


 ゲームのような仮想世界でもこのようにして世界と対話したいものです。そのためにはマルチモーダルという考えが必要になります。マルチモーダルというのは簡単に言うと、複数の手段による情報の入力そして出力となります。

 現実世界、たとえば自然環境に対しても人間は複数の手段によって介入という名の入力を行い、それに対して自然は出力を返しています。これをコンピューターに対しても同様の考えで行うのがマルチモーダルという概念です。

 AGIを用いたゲームを例にすると、我々はキーボードやコントローラーによる入力だけでなく、声や身振り手振りによる入力も想定することができるということです。これはVRを知ってる方には慣れ親しんだ考えかもしれません。

 要するに、人間が出力しうる様々な応答を情報化し、その情報を統合して処理することで、コントローラー側はより人間に近い入力を受けることで、逆に人間側に出力を返す際に、人間にとって慣れ親しんだ現実世界のような出力を返すことが可能になります。

 こうすることでゲームはより真実味を帯びます。
TRPGに例えると、ゲームマスターやプレイヤーの考えたことがすぐに仮想世界の中では質量を持った物体や概念として生まれるということです。

最後に

 なぜ、このような文章に書くに至ったかというと、ChatGPTに対するものの見方、捉え方をもっとコスパに関する生産性の外に向けてほしかったからです。AIは人の仕事を奪うかもしれませんがそれだけではありません。人の力だけでは成しえないようなことも可能にするでしょう。
 この不可逆的なシンギュラリティを悲観的にとらえるのも楽しいですが、新しく想像される汎用人工知能(AGI)という自然と対話できるようになる喜びも味わっていきたいものです。


この記事が気に入ったらサポートをしてみませんか?