見出し画像

Genieという新しいAI パラダイム現る!これでAIの未来はどう変わるのか?

最近、Google DeepMindから Genie: Generative Interactive Environments(1)と言うfoundation modelが発表されました。既存AIには無い機能を持っているとのことなので、今回ここで取り上げていろいろ探っていこうと思います。では始めましょう!

1.actionを実行できる
Google DeepMindのblogには「Genieを紹介します。これはインターネットのビデオから訓練された基礎世界モデルであり、合成画像、写真、さらにはスケッチからも、無限の種類のプレイ可能(アクション制御可能)な世界を生成できます。」とあります。どうも単に画像を生成するだけでなく、その世界で何かを実行して遊べる機能・環境を生成できるという意味でしょうか。ざっくり言うと一枚の画像からゲームを作成できる訳ですね。何だか凄そうです。

2.非教師学習でactionを学べる
一枚の画像からactionをやりとりするinteractionの環境ができるなんてなかなか想像できません。特にどんなactionを取るかを決めることは結構大変なことだと想像できます。でもGenieは30,000時間のビデオをラベル無しの非教師学習で訓練したそうです。ラベル無しのビデオはインターネット上に大量にありますので、訓練用の素材もたくさん得られます。今は2D gameや  roboticsに注力してますが、将来は様々なことに適用できそうです。凄い!

3.あなたが書いたイラストでもgameが作れてしまう
一枚の画像といっても特に制限はなく、何でもGenieに取り込めるようです。本物の写真やアート作品はもちろんのこと、簡単に書いたイラストもOKです。以下の画像を見ると、確かにgameができあがってますね。

4.ここから新しい"AI agent"が生まれる
gameとは言え、実際に環境がつくられ、そこでactionを取ることにより、私達はその環境内に実際に居るように感じることでしょう。actionと言えば"AI agent"を思い出しますね。"AI agent"は私たちのために私たちのかわりに、いくつかの選択肢から自ら判断して選び、実行してくれる訳ですが、その構築環境を私のイラストからでも構築でき、選択肢も自動で設定してくれるのであれば、"AI agent"の生成は格段にシンプルになります。GoogleはYoutubeを持っており、世界を学習するための素材には事欠かないはずです。こう言っている間にも進化していることでしょう。

最後にGoogle DeepMindからのメッセージを紹介して締めくくりたいと思います。「Genieは、画像やテキストから完全なインタラクティブな世界を生成できる時代を導きました。また、将来の汎用AIエージェントの訓練の触媒となるとも信じています。」まだ、Genieは一般向けには公開されていませんが、今後の展開がほんと楽しみです!


1) Genie: Generative Interactive Environments by Google DeepMind 




Copyright © 2024 Toshifumi Kuga. All right reserved

Notice: ToshiStats Co., Ltd. and I do not accept any responsibility or liability for loss or damage occasioned to any person or property through using materials, instructions, methods, algorithms or ideas contained herein, or acting or refraining from acting as a result of such use. ToshiStats Co., Ltd. and I expressly disclaim all implied warranties, including merchantability or fitness for any particular purpose. There will be no duty on ToshiStats Co., Ltd. and me to correct any errors or defects in the codes and the software.

この記事が気に入ったらサポートをしてみませんか?