3つの画期的な発想でAI開発の方向性を大転換させた考え方。Vision Proを活用したAGI開発
現在アメリカで大学と企業のAI共同開発や軍事やファンドのAIベンチャーの人材獲得と更なる出資などの最新AIロボット展示会が開催されている。
日本ではChatGPTを活用したサービスが殆どだが、海外の展示会では殆ど見受けられない。例えばオルガノイドAIや量子AI、独自に開発されたファルコンなど選択肢が非常に多くアイデアが豊富であります。
今回世界1000社のAI開発ベンチャーの中から厳選して3つのコンセプトとそれにより未来がどのように変化していくか考察してみる。
またこの未来の方向性をもとにどのような投資、事業、開発、などをしていくかも戦略的に解説してみる
3つの画期的な発想でライフスタイルを劇的に変化させる
①5分でオリジナルAI開発の何がすごいのか?
ニューヨーク大学とMetaの共同研究チームが開発した「Dobb·E」は、家庭内で多様なタスクを学習できるロボット操作フレームワークです。このシステムは、安価で多様な汎用性を持ち、ユーザーが示したタスクをわずか20分で学習する能力を有しています¹。
Dobb·Eの主なインターフェースは「The Stick」と呼ばれるデモンストレーション収集ツールで、手頃な価格のリーチャーグラバー(マジックハンド)、3Dプリント部品、およびiPhoneを組み合わせて作られています。このツールは、ユーザーによるタスクのデモンストレーションを収集し、それを学習データとしてロボットに提供します¹。
ニューヨーク市内の22軒の家庭で収集された13時間にわたるデータを使用し、「Home Pretrained Representations(HPR)」モデルをトレーニングしました。このHPRモデルは、自己教師あり学習(SSL)技術を採用し、家庭環境でのタスクを効果的に学習します。約30日間にわたるニューヨーク市と周辺地域の10軒の家庭での実験では、異なる環境で計109のタスクに取り組み、そのうち102のタスクで成功を収め、家庭での平均成功率が81%に達しました¹。
しかし、ロボットの力、到達範囲、バッテリー寿命などのハードウェアの制約や、曖昧なセンシング、より複雑で時間的に延長されるタスクでのポリシーフレームワークの問題など、未解決の課題も存在します。研究チームは、今後の家庭用ロボティクスの研究を促進し支援するため、コード、データ、モデル、ハードウェア設計をオープンソース化し、結果の再現を支援しています¹。
Dobb·Eのハードウェア設計は、以下の4つの主要なコンポーネントから構成されています:
1. **The Stick**:
ユーザーがロボットにタスクを示すデモンストレーションを収集するためのハードウェアツールです。安価な部品とiPhoneを使用して作られており、家庭内で快適にロボットのデモンストレーションを収集することができます¹。
2. **Homes of New York (HoNY) データセット**:
The Stickを使用してニューヨーク市内の22軒の家庭と216の環境で収集された1.5百万枚のRGB-Dフレームから構成されています¹。
3. **Home Pretrained Representations (HPR)**:
HoNYデータセットでトレーニングされた軽量な基礎視覚モデルです。このモデルは、新しい家庭環境でわずか5分のデモンストレーションと15分のHPRモデルの微調整を行うことで、多くの単純な家庭内タスクを解決することができます¹。
4. **統合プラットフォーム**:
これらすべてを結びつけ、新しい家庭でデプロイするためのプラットフォームです。約30日間の実験で、ニューヨーク市と周辺地域の10軒の家庭で109のタスクに取り組み、81%の成功率を達成しました¹。
Dobb·Eのハードウェア設計は、家庭内でのロボット操作を学習するための汎用的でありながら手頃な価格のシステムを目指しています。このオープンソースプロジェクトは、家庭用ロボティクスの研究を加速し、将来的にはすべての家庭にロボットの執事をもたらすことを目指しています¹。
詳細なハードウェア設計やその他の技術的な情報については、プロジェクトのGitHubページで確認することができます
https://arxiv.org/pdf/2311.16098
現在この技術を応用した新しいアイデアが20以上創発されており、オープンソース化してくれいるおかげで、我々の開発スピードとコストが大幅に軽減されております。
続きは、会員サイトにて、、
この記事が気に入ったらサポートをしてみませんか?