見出し画像

Microsoft、チャットGPTでロボット動かす ロボットと言葉で交流する未来は来るか?

世界中で人気沸騰の対話型AI(人工知能)「ChatGPT(チャットGPT)」。まるで人が書いたような自然な文章で答えを返してくれるだけでなく、プログラムコードを作ったりもできる。米Microsoftの研究部門ではそうした機能をロボットに応用した。ChatGPTに言葉で指示を与えながらバックエンドで制御プログラムを作らせ、実際にロボットやドローンを要求に沿った形で動かせることを実証したという。

Microsoftの自律システム・ロボット研究グループが発表した技術論文ブログによれば、人間が入力欄に文章で書き込んだ要求や質問(プロンプト)に応じてチャットGPTが制御プログラムを生成。たとえば、「何か飲み物がほしい」といった曖昧な内容の場合、そのままではロボットをどう動作させればいいか不確定なため、AIが選択肢や具体的なニーズを聞き返し、動作を絞り込んでいく。

MicrosoftのロゴについてChatGPTとのやりとりの例(Microsoftのブログから)

もちろん、一発でロボットが思った通りの動きをしてくれるわけではない。いったん出来上がったプログラムによる動作を修正する場合でも、修正内容を言葉で伝えるとAIがプログラムを書き換えてくれる。最初から人間がプログラムを組むより「時間が短くて済み、効率的で低コスト」としている。

こうした仕組みで室内を飛び回るドローンが「健康に良さそう」という要求にマッチした飲み物を選んだり、「芝刈り機のように」という指示に従って左右にジグザグ飛行をしながら搭載カメラで棚を検査したりすることもできたという。さらにAirSimというシミュレーションソフトを使ったデモンストレーションでは、ドローンが「障害物をよけながら進む」というタスクを達成。実物のアーム型ロボットを使った木製のブロック並べでも、「Microsoftのロゴを作る」という目標に対し、知識ベースからその4色のイメージを探し出し、正しい色の組み合わせのロゴを作り上げた(トップ写真=Microsoftのブログから)。

ChatGPTを組み込んだAirSimシミュレーターの画面(Microsoftのブログから)

ただ、こうした自然言語によるロボット制御の取り組みはまだ初期段階で、ロボットができることも限られるようだ。そこでMicrosoftの研究グループでは大規模言語モデル(LLM)をロボット制御に応用する研究者仲間を増やすため、今回の研究に使用されたすべてのプロンプトや会話をPromptCraftという共同オープンソースプラットフォームとしてリリースしている。

実はGoogleでも一足先にLLMや機械学習を統合したロボットの実用化に取り組んできた。2022年にはEveryday RobotsというAIロボットの事業開発会社を設立。親会社のAlphabetが「ムーンショットプログラム」を手がけるX(旧Google X)から独立させた。ロボット自体は1本のアームと移動用の車輪を持ち、社内食堂のテーブル拭きやゴミの分別、ドアの開閉などの動作を訓練してきたという。

テーブルを掃除するEveryday Robotsのロボット(同社のウェブサイトから)

言語認識によるロボット制御では、誰かが「腹がすいた」と言うと勝手にポテトチップスを持ってきてくれるような動作が可能としている。ところが、Wiredの報道によれば、2023年1月にAlphabetが発表した12000人もの大規模リストラに伴い、コスト削減の一環として約200人のスタッフを抱えるEveryday Robotsを閉鎖。Google Researchで進められている既存のロボット研究プロジェクトに統合される見通しという。

Everyday Robotsのロボットについては1台当たりの価格が数万ドルとの推測もある。限定的な機能を考え合わせても家庭やオフィスに簡単に導入できるような段階ではない。生成系AI(Generative AI)の急速な発展が見込まれる中、自然言語によるロボットの制御は始まったばかり。まるで人間を相手にするように、ロボットと自然にコミュニケーションする未来は来るのだろうか。


この記事が気に入ったらサポートをしてみませんか?