見出し画像

Skild AI:人工好奇心で強化学習するロボット用の汎用基礎モデル[3億ドル調達]


 米Skild AI社(ペンシルバニア州)は非上場のスタートアップ企業で、2024年7月9日にLightspeed Venture Partnersなどから3億ドル(約480億円)の資金調達を発表しました。これまでステルス・モードで活動していたため、その企業実態についての情報は限られていますが、様々なロボット・タスクに利用可能な人工の汎用頭脳(General-purpose Brain)の開発を行っている企業です。設立からわずか1年で評価額15億ドルに達し、ユニコーン企業の仲間入りを果たしています。尚、同社社は事業展開の段階には至っておらず、まずはソリューションの開発ありきで取り組んでいる模様です。

  さて、米Skild AI社が開発している人工の汎用頭脳の特徴をかいつまんで説明すると以下となります。

  • 膨大なデータセットで学習させたマルチモーダルな基盤モデルを開発

  • 強化学習による報酬モデルで、人工汎用頭脳が好奇心に駆られてロボティクス・タスクを学習

  • 物理設計から独立分離し、様々なマシンに汎用的に実装可能なモデルを開発

  • これまでのカスタムモデルを汎用モデルで置換し、コストダウンとユビキタス化を指向

 昨今、テスラやOpenAI、HuggingFace、Figure AIなどがヒューマノイド系ロボット領域へ投資しているのは、マルチモーダルな大規模言語モデルの発展を見れば当然の流れと思われますが、このタイミングでのSkild AI社のユニークな点は、やはり汎用頭脳の開発となりますが、現時点ではその動作を確認する術がなさそうなため、今後のお披露目を楽しみにしたいと思います。

(出典)Skild AI



 1. 企業概要

(1)Skild AI社について

 Skild AI社は、2023年5月にカーネギーメロン大学の元教授、ディーパク・パタク氏(Deepak Pathak)とアビナヴ・グプタ氏(Abhinav Gupta)によって設立されました。最近までステルス・モードで活動していたため、企業や事業の情報は限られています。しかし、先日3億ドルの資金調達を行い、評価額が15億ドルとなり、ユニコーン企業の仲間入りを果たしました。
 
 Skild AI社が取り組んでいるのは、様々なロボットに組み込むことができる汎用的な人工頭脳の開発です。具体的には、ロボティクス・タスクを処理するための基盤モデルの開発を進めています。このモデルは環境に適応する能力を持ち、自己発展的にタスクを学習するロボティクス・アプリケーションの実現を目指しています。
 

(2)チームについて

 Skild AI社は、カーネギーメロン大学のディーパク・パタク教授とアビナヴ・グプタ教授の2名の創業者によって設立されました。両者はAIとロボット工学の分野で25年の経験を持ち、カーネギーメロン大学のロボティクス研究所のメンバーでもあります。また、FacebookのAI研究所でトップ・サイエンティストとしての経歴やGoogleでAI研究者としての経験もあります。
 ディーパクがカリフォルニア大学バークレー校の博士課程に在籍中の2017年に「Curiosity-driven Exploration by Self-supervised Prediction(自己教師あり予測による好奇心にもとづく探索)」として発表したロボットに『人工好奇心』を教える研究は、その後、4,000人以上の研究者に参照されており、後に、ロボットがGPTのような大規模言語モデルからの指示を受けて行動に移す道筋を開いた重要な研究であるとされています。
 また、Skild AI社の社内チームには、Meta、Tesla、Nvidia、Amazon、Googleなどの企業やカーネギーメロン大学、スタンフォード大学、カリフォルニア大学バークレー校、カリフォルニア大学ロサンゼルス校などのトップクラスのロボット工学やAIの専門家が参加しています。

(3)これまで資金調達と出資者

 SKILD AI社社は設立以来、複数のラウンドを通じて推定3.145億ドルを調達しています。以下は主要な資金調達ラウンドの概要です。
 
 2023年7月に行われたシード・ラウンドでは、LightspeedとSequoiaから1450万ドルの共同出資を受けました。
そして今回、2024年7月9日に実施されたシリーズAラウンドでは、3億ドルを調達しました。このラウンドのリード・インベスターには、Lightspeed Venture Partners、Coatue、ソフトバンクグループ、ジェフ・ベゾス(Bezos Expeditions)が参加しており、その他にもSequoia、Felicis Ventures、Menlo Ventures、General Catalyst、CRV、Amazon、SV Angel、カーネギーメロン大学が出資しています。

 尚、今回調達した3億ドルは、AI、ロボティクス、エンジニアリング、オペレーション、セキュリティの各分野における人材の採用とチーム作りに使われる他、将来の商業展開に向けたモデル開発や学習データセットの整備・拡張のためにも使用される予定です。
 

(4)ミッション&ビジョン

Skild AI社のミッションとビジョン、そして具体的な目標は以下の通りです。
 
① ミッション
 生産性の向上と人間の可能性を最大限に引き出すために設計された、初の本格的なインテリジェント身体化システムを開発することで、フィジカルワークの未来に革命をもたらすこと
 
②ビジョン
 フィジカルワールドに根ざした汎用人工知能(General Purpose Artificial Intelligence)を構築すること
 
③ 具体的な目標
 あらゆる環境において、あらゆる種類の産業用ロボットや個人用ロボットを動かすための基本的なオペレーティングシステムを開発し提供すること。
 
 尚、この目標に対してですが、Skild AI社は創設からわずか1年で、すでに目覚ましい進歩を遂げています。彼らの基盤モデルは膨大なデータで訓練されており、障害物を回避する能力や、ロボットの指が滑ったり引っかかったりしても物体を操作する能力など、新しい創発的行動を示し始めています。
 
 Skild AI社は今後、検査や監視、マニピュレーションなどのタスクをこなす産業用ロボットの実現に取り組む予定です。環境適応能力を持つ基盤モデルを搭載したロボットは、再学習やファインチューニングを必要とせず、様々な産業や物理環境で多様なタスクをこなすことができる見込みです。この技術は、悪条件を自律的にマスターして適切に動作する四足歩行ロボットや、器用に物体を操作して複雑なタスクをこなすビジョンベースのヒューマノイドの実現につながるとされています。
 
 そして、Skild AI社の最終目標は、インテリジェント・ロボットをユビキタスで普遍的な存在にすることです。
  

(出典)Skild AI

2. 提案価値

(1)課題認識

(a) 労働力が不足する巨大な労働市場
 世界中で労働力不足が叫ばれており、この問題は特に医療、建設、製造、運輸、家庭など、肉体活動に大きく依存する産業で深刻です。多くの作業は危険であったり、複数人で共同して行う必要があったり、身体的に疲労を伴う労働や精神的苦痛を伴う単純な作業もあります。これらの労働市場は世界的に巨大であり、家事や地域活動などの無報酬労働も含めるとさらに大きくなります。フォーブス誌によると、2030年までに世界の人材不足は8,520万人に達し、経済的損失は8兆5,000億ドルに達する可能性があるといわれています。
 AIやロボットは、この労働力の供給不足を解消する手段として期待されており、ロボット関連ビジネスには数兆ドル規模のビジネスチャンスが存在します。しかし、Skild AI社は、「まずはロボットが賢くなる必要がある」とし、「我々はまだ、何百万もの空いたポジションを埋めるのに十分な賢さと能力を備えたマシンを作ることができていない」と課題を指摘しています。
そして、これら労働課題の一部でもロボットで自動化できれば、巨大な市場機会が生まれるとし、「どんな環境でも、どのような態勢でも、どのような自動化タスクでも安全にこなせる汎用ロボットの能力によって、コストを削減し、深刻な人手不足を支援することが可能となる」と述べています。

(b)技術的な課題
 AIやコグニティブな能力の発展によって、ロボティクスによる自動化技術の進展が加速していますが、未だに利用される技術は、その特殊性によってスケールが難しいという課題があります。以下は一般的なアプローチとSkild AI社のアプローチとの違いです。
 
① バーティカルなアプローチ
 バーティカルなアプローチでは、市場の問題を見つけ、それを解決するメカニズムを設計し、そのメカニズムを操作する特製のAIモデルを訓練して実用化します。この方法はスペシャリスト・アプローチとも呼ばれ、多くのロボット・スタートアップが採用しています。このアプローチを取ることで、結果をよりコントロールでき、リスクを抑え、知的財産を完全に管理することが可能になり、現在、ヒューマノイド・ロボットの開発に取り組んでいる殆どのプレイヤーは、このバーティカルなアプローチを採用しています。
 
② ホリゾンタルなアプローチ
 ホリゾンタルなアプローチは、さまざまなタスクを学習できる広範な知的システムを作り、それをあらゆるメカニズムの制御に展開する方法です。これは、人工汎用知能(AGI)への道とも言えますが、その基盤モデルは汎用的な問題に対応できるものの、巨大なAGIにはなり得ないため、基盤モデル・アプローチとも呼ばれています。Skild AI社が進めているのは、この基盤モデル・アプローチによるものです。
 
Skild AI社は、ホリゾンタルなアプローチにより、ロボットのメカニカルな設計要件に依存せず、複数の異なるロボット・アプリケーションに適用できる基盤モデルを開発しています。この基盤モデルは、競合他社のモデルよりも少なくとも1,000倍以上のデータポイントでトレーニングされています。そのため、特定の用途のために作られたバーティカル・アプローチのロボットとは異なり、操作・運動・ナビゲーションを含む多様なシナリオやタスクに対応する汎用頭脳として機能します。
これによって、あらゆる環境で無制限のタスクをこなすことのできる自律型マシンが事実上生まれ、これまでのロボットの概念を変えて、人々の労働を解放したり補完するであろうとしています。

(2)技術的な特徴

 Skild AI社は、急な坂道を登ったり、進路上の障害物を回避したり、物体を認識して拾い上げたりするタスクを実行するための「汎用脳」と呼ばれる基盤モデルを既に開発し、現在、既存のハードウェアに後付けできる汎用システムの開発を進めるとともに、競合他社よりも多くのデータでAIモデルを学習させています。この「汎用脳」を実現することで、従来のカスタムメイドのロボットソフトウェアよりも遥かに低いコストで、ほぼ全ての汎用ロボットに搭載することが可能になるとされています。
  モデルの学習には、テキストや画像、動画といった多様で膨大な実世界データを用いる他、人間がロボットを遠隔制御してタスクを実行・学習させるプロセスも含まれます。これにより、人間がどのように身体的な動きを処理するかをロボットに学習させています。また、ロボットにランダムなタスクを与えて試行錯誤させ、学習データに含まれていなかった行動を推論し実行できるようにする学習も行っています。
  これらの行動は、滑った物体をキャッチすることや、作業中の物体を正しい向きに回転させることなど、かなり微妙なものになりますが、それでもこのような些細な修正は無意識に人間が行っていることであり、人間が汎用的な作業を得意とする理由の一部となっています。このような微妙な運動スキルを持ち、創発的にタスクを習得するロボットは、現在製造現場に配置されている昔ながらの産業用ロボットが非常に高速かつ正確に稼働できる一方で、柔軟性を持って様々なタスクに汎用的に対応できないという課題を解決できるとされています。
 
Skild AI社の基盤モデルには以下の特徴があります。

① 大規模データによる学習
 一般に、競合他社が利用するデータセットよりも規模が1,000倍大きいテキスト、画像、ビデオの巨大なデータベース上でモデル学習を行っています。
 
② リアルワールド・データ
 人間がロボットを遠隔操作してその行動に関する実際のデータを収集して学習させるほか、ロボット自体にランダムにタスクを実行させ、試行錯誤を通じて学習させています。
 
③ 人工好奇心(Artificial Curiosity)
 ディーパックの研究に基づき、ロボットの「人工的な好奇心」を活用しています。報酬モデルを利用し、ロボットが予測できないことでも達成に応じて報酬を与えるというもので、シミュレーションからの知識、動画からの学習、好奇心からの学習、そしてこれらに加えて、実際のデータを組み合わせるというアイデアに基づいてモデルの行動を促しています。
 

(3)技術がもたらす価値

 Skild AI社の方法論は、ロボットやタスクにまたがる汎化能力と創発能力を提供し、実世界のシナリオにおける自動化を大幅に改善することが可能です。この方法論は、ロボット工学のスケーラビリティにおける重要なブレークスルーをもたらす可能性を秘めています。
 Skild AI社の基盤モデルは、比較的安価な機械も含め、事実上どのような市販の機械でも動作させることができるため、産業分野において大きな競争優位性を持つと考えられています。将来的には、消費者向けロボット市場への参入機会を得て、どんな環境でも、どんな態勢でも、どんな自動化タスクでも安全にこなせる汎用ロボットをコストを抑えて実現することが期待されています。

(出典)Skild AIより
(出典)Skild AIより

3. 人工好奇心について

 ディーパク・パタク氏の「人工好奇心」(Artificial Curiosity)は、ロボットやソフトウェアのエージェントが自主的に学習するための新しいアプローチを示すもので、外部から与えられる報酬や指示に頼らず、エージェント自身が未知の環境やタスクに対して興味を持ち、探求し、学習する能力を促進することを目指すものです。
 人工好奇心の主な概念は、エージェントが自分自身で課題を設定し、その解決を通じて新しい知識やスキルを獲得するというもので、このような人間の学習過程に似せたアプローチによって、エージェントがより効率的かつ柔軟に新しいタスクや環境に適応できるようにするものです。
ディーパクの研究には、以下のような要素が含まれており、ロボット工学、自律走行車、ゲームAIなど、さまざまな分野で応用され、より高度なAIシステムの開発に貢献しています。
 
① 自己指導型学習(Self-directed learning)
 エージェントが自分で学習目標を設定し、達成するためのステップを計画する。
 
② 内部報酬システム(Internal reward system)
 外部からの報酬に頼らず、エージェントが自分で進歩を評価し、学習を促進するための内部報酬を生成する。
 
③ 環境探索(Environmental exploration)
 エージェントが未知の環境を探索し、新しい情報を収集し、それを基に学習を進める。
 

※ 論文の原文については、以下を参照して下さい。 



以上です。


 最後までお読み頂きまして誠に有難うございます。
役に立ちましたら、スキ、フォロー頂けると大変喜び、モチベーションにもつながりますので、是非よろしくお願いいたします。 



だうじょん


免責事項


 本執筆内容は、執筆者個人の備忘録を情報提供のみを目的として公開するものであり、いかなる金融商品や個別株への投資勧誘や投資手法を推奨するものではありません。また、本執筆によって提供される情報は、個々の読者の方々にとって適切であるとは限らず、またその真実性、完全性、正確性、いかなる特定の目的への適時性について保証されるものではありません。 投資を行う際は、株式への投資は大きなリスクを伴うものであることをご認識の上、読者の皆様ご自身の判断と責任で投資なされるようお願い申し上げます。


この記事が気に入ったらサポートをしてみませんか?