見出し画像

生成AIが切り拓くXR/メタバース世界の実現 | XR/メタバースにおける生成AIの5つの役割

生成AIブームの裏でメタバースブームはすっかり勢いを失ってしまってように見える。

しかし、昨今の生成AI技術の発展によって、いままでXR/メタバース領域で大きな課題とされたいた事項が1つずつ解消されつつあり、XR/メタバース領域が大きく立ち上がる素地が整いつつあるのはあまり知られていない。

このnoteでは、XR/メタバース領域において生成AI技術が果たす5つの役割について触れながら、近い将来実現するであろうXR/メタバース世界の姿について考えていく。

XR/メタバース領域において生成AI技術が果たす役割は以下の5つだ。

1. 毎回変化する体験の実現
2. 同期的体験の過疎問題の解決
3. ユーザー投稿負荷の軽減によるCGMの実現
4. コンテンツ制作費のボトルネック解消
5. マルチモーダルで自然対話可能なインターフェースの実現

これから、その兆しとなる実際のサービス事例を紹介しながら1つずつ解説していく。

1. 毎回変化する体験の実現

XR/メタバース体験のボトルネックの1つが、体験/コンテンツの更新性だ。

制作コストが高いこともあり、ほとんどのXR/メタバース体験は一度作られた体験から頻繁に更新されることはなく、その結果「1度体験されたら満足されて終わり」というXR/メタバース体験が多い。

そんな中で、XR/メタバース領域のスタートアップ「Sensorium」は、AI DJが作曲した音楽をプレイする24時間年中無休のメタバースライブを展開している。

Sensorium Galaxy

完成度が高く毎回変化する音楽が流れるなか、AIダンサーたちのパフォーマンスや空間演出を楽しむことができる。

訪れるたびに変化するサウンドとパフォーマンスを提供してくれるので、多くのメタバースが1回で飽きられてしまう一方で、Sensorium Galaxyは何度も訪れたくなる空間になっている。

実際、Sensorium Galaxyは公開から2週間で400万回以上のアクセスを記録し、いまなおユーザーを引き寄せる空間になっている。

以下リンクから実際のライブ空間を観ることができるので、ぜひ1度観てみてほしい。


2. 同期的体験の過疎問題の解決

特にメタバースはその定義上、リアルタイムにつながる体験(=同期的体験)に重きを置く。

その結果、投稿など過去のユーザーの行動を後追いで楽しむことができるX(Twitter)やInstagramなどの非同期的体験よりも圧倒的に「過疎りやすい」。

そんな中で、生成AIスタートアップの「Inworld」は大規模言語モデルを使って、事前に設定されたキャラの性格や背景ストーリーに基づいてプレイヤーと自然な対話が可能なNPCキャラクター(ex.ドラクエの村人)をゲーム内に簡単に実装できるサービスを提供している。
(「Inworld」は実際のゲームや体験にも取り入れられ始めており、今月8月に$50Mを追加調達し、評価額$500Mにまでなっている。)

この領域では「Inworld」以外にも「Convai」などのサービスも伸びてきており、こうしたサービスによって同期的体験(=リアルタイム体験)に重きを置きつつも過疎らない、つまり寂しくないメタバース体験を提供することが可能になる。

3. ユーザー投稿負荷の軽減によるCGMの実現

XR/メタバース体験が本格的にメインストリームになるためには、ユーザー自身がコンテンツをつくり、それを他ユーザーが楽しむことが当たり前の状態、つまりCGM(Consumer Generated Media)になることが必要不可欠だ。(InstagramやYoutubeなどはまさにそれ。)

そして、そのためには3Dという複雑なメディアフォーマットでもユーザーが簡単に投稿できる状態、すなわち3D制作やワールド制作も誰でも簡単にできる状態を実現していく必要がある。

2Dモバイルゲームの領域で「Roblox」はユーザーが作ったゲームを他ユーザーが遊べるCGMとしてすでに成り立っているが、さらにユーザー投稿のハードルを下げるべく、クリエイター向けツールに生成AI機能を導入することを今年2月に発表した。

クリエイターはテキストで指示するだけで3Dモデルのテクスチャやライティング、挙動を編集することができる。

また、NFT3Dギャラリーとしてよく使われてるOncyberもGPTを組み込み、テキストを打ち込むだけで3D空間内の装飾を編集できる作れる機能を発表している。

このようにユーザーが誰でも簡単にコンテンツを投稿できるようになれば、先述のXR/メタバース体験の更新性の問題も大きく解決される。


4. コンテンツ制作費のボトルネック解消

XR/メタバース領域のボトルネックの1つが、制作費の高さだ。

わたし自身もXR/メタバース領域のクリエイティブスタジオを経営していたので実感しているのだが、XR/メタバース領域で何かをつくろうと思うと同規模のWEB/モバイルアプリプロジェクトに比べると(もちろん単純比較は難しいが)コストが平気で3~5倍はかかってしまう。

この問題の解消に生成AI技術は救世主になりうる。

「Promethean AI」は、生成範囲をドラッグアンドドロップで指定し、プロンプト入力をするだけで簡単に高クオリティの3Dワールドを構築可能にしている。

また、テキストプロンプトから3Dアセットを生成してテクスチャなどの微調整も可能な「Kaedium」などXR体験のコンテンツ制作費を大幅に下げる生成AIサービスがいくつも登場してきている。
※ Kaedium自体は裏側で結構人力でモデル作成している部分もあるそう


こうしたサービスによってXR/メタバース体験の構築費が桁1~2つ安くなることで普及のハードルは大きく下がる。


5. マルチモーダルで自然対話可能なインターフェースの実現

XR/メタバース領域におけるインターフェースは、現状ユーザーにとって負荷の大きなポイントになっている。

三次元空間での複雑な操作をポインターやハンドジェスチャー、声のみで操作するのはやや無理がある。

その課題に対して、テキストや画像など複数種類のデータを扱えるマルチモーダルな大規模言語モデルはより自然なインターフェースの実現に役立つ。

「Iris」では、AIに声で指示できるだけでなく、画面の特定領域を指定し、その領域の画像をAIに読み取らせて返答をしてもらうことで、より自然なインタラクションを実現している。

つまり、「これをこうして、それをああして」と「こそあど言葉」のインターフェースを実現しているのだ。

また、Apple出身でウェアラブルARデバイスのHumaneを開発するImran Chaudhri氏がTed Talkで披露したデモでは、胸元のカメラ付きデバイスに内蔵されたAIに目の前の食品をアレルギー的に食べられるかを判断してもらい、音声で教えてもらっている。

このように、我々が誰かに操作を指示して代わりにやってもらうような自然な形でマシンを操作するインターフェースが実現しつつあるのだ。

まとめ

XR/メタバースが本格的に普及するためのハードルは3つある。

1. キラーユースケースの発見
2. コンテンツ制作費の大幅軽減
3. 普段使いできて十分なスペックのデバイスの登場

この中で生成AIは1と2のハードル解決に大きく寄与する。

自然で柔軟な対話が可能なAI NPCの実現は、「XR/メタバーススクール」や「バーチャル彼氏/彼女」「XR/メタバースカウンセリング」など多くのキラーユースケースの実現を可能にし、これまで重くのしかかっていたコンテンツ制作費を大きく低減する。

あとはApple、Meta、Nrealなどの企業によって3つ目のハードルが解決されればXR/メタバースの本格的な普及に大きく近づく。

生成AI発展の道の先には、XR/メタバース世界の実現が待っているのだ。

さいごに

日々AIなどの先端テックや、プロダクト関連の発信をしているので、ぜひフォローお願いいたします。


AIやXRなどの先端テック、プロダクト戦略などについてのトレンド解説や考察をTwitterで日々発信しています。 👉 https://twitter.com/kajikent