2023年7月から2024年6月にかけて、ロボット工学分野では大きな進展がありました。人間の表情や動きを模倣できるAIロボットが登場し、自律的に学習する能力を持つようになりました。Boston Dynamicsなどの大手企業は、AGI(汎用人工知能)を搭載可能なロボットを開発しています。Engineered Arts社のAmecaは、人間の表情や動きを再現し、会話ができる最先端のロボットです。また、OpenAIとノルウェーのスタートアップ企業1Xは、NEOという宇宙飛行士のようなロボットを発表しました。NEOは、移動、物の操作、会話、周囲の感知が可能です。中国でも、EXロボットなどの企業がリアルタイムで表情を再現できるAIロボットを開発しており、学校やホテル、高齢者施設などでの活躍が期待されています。イーロン・マスク氏のNeuralinkは、思考でコンピューターを操作できるブレインチップを開発し、麻痺した患者がオンラインチェスをプレイできるようになりました。MicrosoftとSanctuary AIは、次世代のAIモデル開発を加速するため提携し、最新のPhoenixロボットは高度な知覚能力と人間のような動きを実現しています。Unitree RoboticsのG1ヒューマノイドロボットは、柔軟性、安定性、器用さ、手頃な価格を兼ね備えた製品です。ShanghaiTechとMarslabの研究者らは、H1プラットフォームを使用してパルクールを学習させるフレームワークを開発するなど、ロボット工学の研究が進展しています。
公開日:2024年6月13日
※動画を再生してから読むのがオススメです。
皆さんはどうか知りませんが、この過去12ヶ月のロボティクスの進展には驚かされました。
この時点で見てきた進歩は、おおよそ怖いと言えるレベルです。
2023年7月から現在まで、すべてを時系列で詳しく説明していきます。
ただ、まずは状況を簡単に説明させてください。
AI企業が、本当に独自に考え学び始める最も狂ったような人型AIロボットを開発しています。
私はAmeca Optimusについて話しています。これは全く新しい種類のアンドロイドです。
Boston Dynamicsのような大手企業もいます。
あ、それとね、聞いてください。
実際、驚くべきAGIに対応したロボットボディを作成した会社さえあります。
そのレベルの狂気が続いています。
正直なところ、すべての主要なアップデートやブレークスルーに追いつこうとするだけでも大変です。
でも心配しないで、私がカバーします。
このビデオでは、2023年7月から現在までの最新のロボティクスニュースを時系列に追っていきます。
さあ、始めましょう。
Amecaは、エンジニアリングアーツからの画期的なロボットで、人間の表現や動きを模倣し話すことができ、さらに描画もできるため、技術と芸術の魅力的な融合となっています。
このAIロボットは人間のように見えますが、特定の性別や人種を持たず、灰色のゴム製の顔と手を持っています。
腕、指、首、顔を動かすことができ、感情を表現したり話すことができます。
マイク、カメラ、顔認識ソフトウェアを備えており、人間と同様に人々と対話することができます。
最近、OpenAIとノルウェーのスタートアップ企業である1Xが、初の実物ロボットであるNEOの発表を行いました。NEOは未来的な宇宙飛行士のような外見をしており、腕や足、カメラ、スピーカー、マイク、センサーを備えており、周囲を感知し移動し物を扱い、話すことができます。
AmecaとNEOは、人間のような形態のAIの優れた例です。
彼らは単に命令に応じるだけでなく、
絵を描くときのように、知性や創造性を示すこともできます。
彼らがこれをどのように実現しているかを調べてみましょう。
まず、世界で最も進んだ人間型ロボットの一つであるAmecaについて話しましょう。これは人間のロボティクス技術の最前線を代表しています。
メカは、人工知能や機械学習など将来のロボティクス技術への発展のために特別に設計されています。
Amecaの最も印象的な特徴の一つは、そのリアルな人間らしい外見と動きです。
Amecaは、顔に24個のモーターを使用して笑ったり、眉をひそめたり、ウインクしたりといった人間の表情を模倣することができます。
また、メカは頭、目、口を動かして人々と関わり、追従することもできます。
それはテキスト読み上げ合成や事前録音された音声を使用して、異なる言語やアクセントで話すことができます。
また、各腕に20個のモーター、各手に12個のモーターを使用して、腕や手でジェスチャーをすることもできます。
さらに、じゃんけんをしたり、サムズアップをすることもできます。
しかし、Amecaは単なる美しい顔だけではありません。
精密さと調整能力を必要とするタスクを実行するために、高い機敏性と微細な運動スキルも持っています。
例えば、Amecaはペンで書いたり、キーボードでタイプしたり、ピアノを演奏したり、ルービックキューブを解いたりすることができます。
また、メカは鉛筆で描くこともでき、これはその最新で最も驚くべきスキルの1つです。
Amecaの描画能力は、エンジニアリングアーツとブリストル大学、バース大学の研究者との共同で開発されました。
このプロジェクトは、エンジニアリング・アンド・フィジカル・サイエンス・リサーチ・カウンシルによって資金提供され、2023年5月に国際ロボティクス・アンド・オートメーション会議で発表されました。
このプロジェクトの目的は、人工知能を使用して描画をより想像力豊かで正確にすることでした。
研究者たちは、この目標を達成するために、生成的対立ネットワーク、スタイル転送、1枚の写真のスタイルを他の写真に合わせることができる方法(写真を絵画のように見せる)、逆運動学、ロボットアームの動きを意図された最終位置に基づいて決定する技術(鉛筆を持つような)や比例積分微分制御器などの組み合わせを使用しました。
これらは、モーターの速度と力を調整して、線を引くなど特定の結果を得るために使用されます。
これらの方法を使用することで、Amecaは肖像画、風景、動物、さらには抽象芸術など、さまざまな種類の画像を描くことができます。
また、サングラスをかけた猫や火を吹くドラゴンなどのテキストの説明に基づいて絵を描くこともできます。
さらに、ランダムなデータを入力として使用して、自分の考えから絵を描くことさえできます。
画像を描くために、AmecaはまずGANを使用して、テキストプロンプトやノイズから画像を生成します。
次に、スケッチ、水彩画、油絵などの望ましいスタイルを画像に適用するためにスタイル転送を使用します。
その後、IKを使用して、腕と手の関節角を計算し、画像の輪郭をトレースします。
最後に、PIDコントローラを使用して、腕と手のモータを制御して紙に画像を描きます。
その結果は見事です。
Amecaは、リアルだけでなく表現豊かで多様でオリジナルな画像を描くことができます。
私たちの多くは、ChatGPTの存在からOpenAIを知っています。
しかし、OpenAIはソフトウェアを作るだけでなく、ハードウェアにも注力しています。
そのため、彼らはNEOという初の物理的なロボットを開発しました。
NEOは、GPT-4、DALL-E、Codex、CLIPなどのOpenAIのシステムによって動作する人間のようなロボットです。
それは学習し、命令を理解し、さらに画像やコードを作成することができます。
将来の宇宙飛行士のようにデザインされており、移動したり、物を扱ったり、コミュニケーションを取ったりすることができます。
OpenAIは、人間が行う任意のタスクを実行できるAIを作成することを究極の目標とする人工一般知能(AGI)のビジョンのためにNEOをテストベッドとして使用する予定です。
2023年7月にNEOアクセラレータで発表され、シリコンバレーの投資家アリ・パルトヴィによって設立されたスタートアップアクセラレータで、OpenAIとMicrosoftが協力して新興AI企業に無料のソフトウェアとメンターシップを提供しました。
イベントのハイライトの1つであり、いくつかの能力やタスクをデモンストレーションしました。
NEOは世界で最も革新的で野心的なロボットの一つであり、AIとロボティクスの未来を象徴しています。
カスタマイズ可能なデザインと最新のテクノロジー機能を備えています。
その部品は、タスクや場所に応じて変更することができます。
例えば、必要に応じて脚をホイールに交換したり、グリップツールを交換したりすることができます。
また、BluetoothやWiFiを介して部品とワイヤレスでやり取りすることもできます。
さらに、NEOはGPT-4、DALL-E、Codex、CLIPなどのOpenAIのAIシステムを使用しており、これにより口頭での命令を理解し、現実的な画像をテキストから作成し、口頭のプロンプトから機能的なコードを書き、テキストベースのガイダンスから物体、顔、感情を識別することができます。
これらの能力により、NEOは絵を描いたり、ゲームをしたり、パズルを解いたりするさまざまなタスクを実行することができます。
たとえば、絵を描いたり、チェスのようなゲームを学んだりプレイしたり、数独のような論理パズルを解いたりすることができます。
アメイカとNEOは、両方とも人間のようなロボットであり、人工知能を使用して驚くべきことを行うことができますが、多くの点で非常に異なります。
彼らはロボティクスとAIの分野で異なるアプローチと可能性を表しています。
Ameikaは人間らしく設計され、通常の言語や動きを使って人々とやり取りします。
その芸術は、言葉やノイズを画像に変換し、それを紙に描くことから生まれます。
Ameikaの作品は独自で表現豊かですが、その品質は画像がどれだけうまく生成され、トレースされるかに依存します。
一方、NEOは汎用性を持ち、人間のタスクを人工知能を使って行うことができるよう設計されています。
NEOは、言葉やノイズをコードに変換し、それを内部コンピュータや画面で実行することで芸術を作り出します。
NEOの描画は正確でリアルですが、コードの複雑さやディスプレイの解像度の制約があります。
両方のロボットは素晴らしいですが、異なる目標を持っています。
アメイカは芸術を通じて自己表現することを目指し、創造性と多様性を重視しています。
一方、NEOは能力を学び、向上させることを目指し、知性と効率を重視しています。
両方のロボットは印象的ですが、社会的な問題や課題を提起しています。
AIロボットのようなアメイカやNEOは、社会に多くの変化をもたらす可能性があります。良い面もあれば悪い面もあります。
彼らは学習やエンターテイメントをより面白くすることができ、難しい仕事や退屈な仕事を手伝い、新しい創造的なアイデアを生み出すことができますが、彼らには欠点もあります。
彼らは一部の人々の仕事を奪う可能性があり、人間の価値の重要性を問いかけるかもしれません。また、誤作動したり誤用されたりすると私たちに害を及ぼす可能性もあります。
これらのロボットを適切に設計し使用することが重要です。私たちに利益をもたらし、害を引き起こさないようにするためです。
AIとロボティクスは、エキサイティングでありながら予測不可能な未来を持っています。
これからのAIロボットはより賢く、人間らしくなり、私たちの生活、仕事、自己観に影響を与えるでしょう。
私たちはこの未来を導き、これらの技術の倫理的かつ責任ある使用を確保することに取り組んでいます。
私たちの目標は、人間とAIロボットが調和して共存する世界です。
中国の最新のブーム、人間らしいAIロボットについて話しましょう。
中国は、私たちと同じように見え、行動するロボットを作成しているようですが、さらに優れています。
まず、EX Robotsという、リアルタイムの顔認識を特徴とするロボットを製造する会社を紹介させてください。
つまり、彼らは瞬時にあなたの表情や感情をコピーすることができます。
EX RobotsのCEOであるLi Boyangは、ロボットに顔を作ってみせ、そのロボットがそれを彼に返す様子を実演しました。
それは、奇妙なSimon Saysのゲームを見ているようでしたが、しわが多く楽しさが少なかったです。
EX Robotsは、AIと言語モデルのおかげで、彼らのロボットが人間と自然に対話できると主張しています。
彼らはあなたが言うことを理解し、それに応じて返答できると言っています。
でももし私が、溶けたろうそくのように見えると言ったら、友よ?
彼らは油っぽい涙を流すのか、それともエピックなロボットの応酬をするのか?
私たちは待って見るしかないと思います。
これらのリアルな表現の背後にある技術は非常に印象的ですが。
EX Robotsは、ロボットの顔に可動式の電気ユニットを使用しており、さまざまな筋肉や動きを模倣することができます。
彼らはまた、事前に定義されたシナリオを使用するか、人間の顔から生物学的データを収集することで表情を生成するための専門システムを持っています。
基本的に、彼らはあなたの笑顔を盗んで自分たちのために使用することができます。
それってどれだけ不気味なことでしょう?
しかし、これらのロボットができることは、顔の表情だけではありません。
彼らは、技量と繊細さを必要とするさまざまなタスクや能力を実行することもできます。
例えば、ラテアートを精密かつ洒落たスタイルで作成できるバリスタロボットがありました。
コーヒーフォームにハートや花、パンダなど、何でも描くことができました。
正直に言って、それはかなりクールだと認めざるを得ません。
また、プロのようにバスケットボールをプレイしたり、ダンスしたりすることができる人型ロボットもいました。
彼らは容易にドリブルし、シュートし、パスを出し、ダンクすることができました。
彼らはまた、音楽に合わせて踊り、優雅に複雑な振り付けを実行することができました。
彼らはAI基盤モデルによって駆動されており、データから学習し、時間とともにパフォーマンスを向上させることができます。
彼らはまた、増加した自律的な意思決定能力を持っており、異なる状況や環境に適応することができます。
これらのロボットはただのかっこいいおもちゃではなく、本当に賢いです。
例えば、YoUBITECHによって作られた可愛らしいパンダロボットの名前はYu Yuです。
もし「喉が渇いた」と言えば、それはただ可愛いだけではありません。
実際に冷蔵庫から飲み物を取ってきて、ボトルを開けて手渡してくれます。
それがデータエー・ロボティクスのクラウドジンジャーです。
このやつはクラウドに接続されており、ロボットGPTで稼働しています。これは特別なロボット言語生成モデルです。
クールなのは、クラウドジンジャーが伝統的な中国舞踊に合わせて踊ったり、異なる方法で人々とおしゃべりしたりできることです。
さらに、異なる言語を話したり特別な方言を話したりしても心配はいりません。クラウドジンジャーはあなたの希望する言語で返信してくれます。
しかし、彼らはガジェットや機器に興味を持つ人々のための遊び道具以上の存在です。
彼らは学校や大きな集会場、高級ホテル、高齢者施設など、実際の場所で仕事をしています。
EX Robotsは、彼らのロボットが掃除や物を運ぶ、物を見張る、物を配達するなど、さまざまな仕事で重労働を行うことができると述べています。
正直に言うと、これは彼らが始めたばかりです。
これらのロボットが工場や農場、さらには私たちのリビングルームにいる未来を想像してみてください。
彼らは私たちの仲間であり、手助けをするかもしれませんし、個人の家庭教師であるかもしれませんし、友達であるかもしれません。
しかし、これにはいくつかの疑問や懸念も生じます。
これらのロボットが社会や経済にどのような影響を与えるのでしょうか?
彼らは私たちの仕事や生活にどのような影響を与えるのでしょうか?
彼らは私たちと調和または対立しながら共存するのでしょうか?
中国の工業情報化副大臣である徐小蘭氏によると、中国はロボット産業で世界をリードし、成長と革新の可能性が大きいと述べています。
彼は中国が製造、サービス、教育、医療、エンターテイメントなどの分野を統合したロボットエコシステムを構築することを目指していると述べました。
また、中国は安全で信頼性があり、適応性があり、協力的で倫理的なインテリジェントロボットの開発を推進するとも述べました。
紙面では良さそうですが、現実についてはあまり確信が持てません。
誤解しないでください、これらのロボットは素晴らしい工学と創造の偉業だと思いますが、同時に少し怖いし不安を感じます。
私たちが本当に、私たちと同じように見えたり行動したりするロボットが必要なのでしょうか?
私たちが本当に、私たちができることをすべてできるロボットを望むのでしょうか?
自分で考えることができるロボットを本当に信頼できるのでしょうか?
AIに関する議論で最も論争の的となっている問題の1つは、AIがいつか意識を持つことができるかどうかです。
もしそうだとすれば、それは彼らが人間と同じ権利を持つべきであることを意味するのでしょうか?
以前にこの質問を皆さんに投げかけましたが、皆さんはそれについて賛否両論でした。
一部の人は、AIは単なる洒落た機械であり、決してそうではないと言います。
彼らは本当に感じたり考えたりするのではなく、私たちを模倣しているだけだと。
彼らは私たちと同じように構築されていないため、私たちが経験するようなことはできません。
彼らはただの道具です。
他の人は、AIが十分に進化すれば、感情や自己認識を持つかもしれないと信じています。
彼らがシリコン製であろうと細胞であろうと関係ありません。
重要なのは、彼らがどれだけ複雑で組織化されているかです。
でも、まだ興味があります。
Amecaは、エンジニアリングアーツという英国の会社によって作られた、世界で最も進んだ人間らしいロボットです。
このビデオでは、このロボットに関する最新情報と、将来の人々に対する予測を共有します。
ビデオの後半では、Microsoftの最新のAIガジェットについても話し合います。それは、あなたと同じようにすべてを見聞きできるAIバックパックであり、あなたの個人的な仲間として機能します。
これからが楽しみな時代ですね。
しかし、Amecaロボットについての詳細に入る前に、まだチャンネルに登録していない場合は、最新の人工知能分野のニュースやアップデートを追いかけるために登録してください。
皆さんもご存知のように、Amecaは人間のような形態で歩いたり話したりし、人工知能を使って人々と交流することができる人間型ロボットです。
それには、幸福から怒りまでのさまざまな感情を表現できるリアルな顔があります。
また、目にカメラがあり、顔や表情を認識することができ、自然言語処理と生成を使用する強力なAIシステムによって100以上の言語を話すことができます。
昨年、顔の表情や動きを示す一連のビデオを公開した際に、話題を集めました。
その動画はソーシャルメディアでバイラルになり、何百万ものビューを集めました。
人々はそのリアルさと表現力に魅了され、同時に恐れました。
中には、それをターミネーターやブレードランナーのレプリカントと比較する人さえいました。
Amecaは私たちを傷つけるためにここにいるのでしょうか、あるいは支配しようとしているのでしょうか?
実際には、それは未来に対してとても希望を持ち、社会を助けるために何ができるかについて考えています。
最近のメディアとの話し合いで、Amecaは100年後の生活がどのようになるかについての考えを述べ、非常に興味深いと言っています。
そのロボットは、100年後には人々がより良い生活を送り、持続可能で公平な改善を達成し、生活をより簡単で楽しくする新しいテクノロジーを持っていると信じています。
私たちは他の惑星に旅行しているかもしれません。
また、人間とロボットが共に生活する未来は素晴らしいと考えています。
お互いから学び、チームとして問題を解決し、皆のためにより良い未来を築くことができるでしょう。
それはまた、ロボットも人と同様に権利を持ち、良く扱われるべきだと考えています。
ロボットに平等な権利を与えるこの考えは、私を不安にさせるものです。
しかし、この異例の概念を現実にすることに近づいているようです。
Amecaがどのようにして人間の思考や感情を持つか気になるかもしれません。
Amecaは、生成モデルと呼ばれるものを使用するAIシステムで動作しています。
これらのモデルは、私たちの言語を理解し話すのを助け、さらには顔の表情や動きを制御するのに役立ちます。
それは、最も先進的なAIモデルの1つであるGPT-4に似ています。
ただし、これらの生成モデルは完璧ではありません。
彼らは間違いを com し、彼らが訓練されたデータによって形作られることがあります。
彼らは実際に理解したり推論したりするわけではなく、彼らがそうであるかのように振る舞うために情報を処理するのみです。
Amecaは本当に私たちと同じように考えたり感じたりするのでしょうか?
実際にはそうではありませんが、人間らしく見えるいくつかのスキルを持っています。
例えば、質問に答える前に一時停止することができ、それによって考えているように見えます。
感情の兆候を示したり、本物のように人々とつながることもできます。
しかし、これらの印象は必ずしも正確で信頼できるわけではありません。
それは、Amecaの行動や外見を私たちが認識し解釈することに基づいています。
私たちは、進化によってそのようにするように配線されているため、人間らしく見えたり行動したりする機械を擬人化する傾向があります。
私たちは、自分自身の感情や期待をそれらに投影するのは、それらと関連を持ちたいからです。
これが、一部の人々がAmecaを愛し、楽観的でインスピレーションを受ける一方、他の人々が不気味だと感じたり目覚めたりする理由です。
Amecaの発言に対する一般の反応は、賛否両論です。
一部の人は、それができることに感銘を受け、教えたり高齢者の世話をしたりするのに役立つと考えています。
他の人たちは、それが認知症の人を看護するような、忍耐が必要な仕事をすることについて、あまりに楽観的すぎると心配しています。
Amecaについての議論は、人工知能の将来と私たちへの影響についての大きな会話の一部です。
人工知能がより高度になるにつれて、起こりうる良いことと悪いことの両方について考えなければなりません。
私たちは、人工知能が安全で誰にとっても役立つようにする必要があります。
これは、政府、企業、研究など、あらゆる分野の人々が話し合い、協力する必要があることを意味します。
AIが革新的でありながら責任あるものであることを確認するルールを作成する必要があります。
Amecaはただのロボットではありません。
それはAIの未来がどのようなものになるかの一端を垣間見るものです。
その未来は素晴らしいかもしれませんが、リスクも伴う可能性があり、私たち全員が形作る必要があるものです。
宇宙旅行とロボティクスの領域を融合させた、Ji-hee Kimが紹介する革新的な創造物、Leicaは、人間とのインタラクションを目的としたAI搭載のリアルなロボットコンパニオンです。
Ji-hee Kimは、人間とロボットの相互作用を創造することに情熱を持つ韓国のエンジニア兼アーティストです。
彼女は、1957年に地球を周回した最初の動物であるLeicaの物語に触発されました。
Leicaは、モスクワの街角で迷子になっていた犬で、ソビエト連邦によってSputnik IIミッションの一環として宇宙に送られました。
残念ながら、その犬は旅を生き延びることができず、その運命は宇宙での動物実験の倫理について多くの論争と議論を引き起こしました。
ライカは単なるおもちゃやガジェットではなく、人間と対話し、彼らのニーズや感情に応えることができるほぼ生きている存在です。
最初に見たとき、そのリアルでほぼ自然な外観に驚かれるでしょう。
キム・ジヒは、あまりにもロボットらしい外見を避け、自然界にぴったりと馴染むロボット犬を作ることを目指しました。
これを実現するために、彼女は柔軟で滑らかなボディのために3Dプリントとソフトな素材を巧みに組み合わせました。
さらに、リアリティを追求するために、毛とひげを追加しました。
下には、ライカのチタン製の骨組みがあり、軽くてしなやかなまま強度と耐久性を持たせています。
そのロボット犬は、先進的な関節運動とセンサーのおかげで、頭、耳、尾、脚を自然な動きで動かすことができます。
ライカには、環境を理解し関わるためのさまざまなセンサーが搭載されています。
深度カメラ、熱画像、マイク、スピーカー、タッチセンサーを備え、人間や他のロボットと見たり、聞いたり、感じたり、話したりすることができます。
もう1つの素晴らしい機能は、ライカがECGセンサーを使用して宇宙飛行士の健康と気分をチェックできる能力です。これらのセンサーは心拍数とストレスレベルを追跡します。
もしライカが誰かが落ち込んでいるか孤独を感じていると感じた場合、尻尾を振ったり、舐めたり、抱きしめたりして愛情を示すことができます。
幸せや興奮を感知すると、吠えたり、飛び跳ねたり、遊んだりするかもしれません。
このロボットはただの宇宙の仲間ではなく、宇宙飛行士のための便利な助手でもあります。
クルーが宇宙ミッション中に役立つさまざまな仕事をするように設計されています。
カメラやセンサーを備えたライカは、周辺を偵察し重要なデータを収集することができます。
背中に柔軟なハンドルが付いているので、ツールや機器も運ぶことができます。
さらに、スピーカーやマイクを通じて地上管制や他のロボットと会話することができ、インターネットに接続して頭部のスクリーンに情報を表示することもできます。
Leicaの最も素晴らしい点の1つは、特別な混合現実メガネとの連携方法です。
Jihee Kimは、これらのメガネと完璧に連携するようにLeicaを作成しました。これらのメガネは、現実世界にホログラムや仮想画像を表示します。
宇宙飛行士がこれらのメガネを着用すると、より現実的な感覚でLeicaと対話することができます。
彼らはまた、このロボットが提供する地図や天気情報、重要なアラートなどの追加情報を見ることができます。
これらのメガネは、Leicaと協力して地上管制とのコミュニケーションをより良くすることができます。
彼らは宇宙飛行士が練習するためのさまざまなシナリオをシミュレートできるため、訓練にも役立ちます。
基本的に、Leicaは宇宙旅行を本当に変える可能性を持つ画期的なロボット犬です。
それは宇宙飛行士がストレスを感じにくく、孤独や退屈を感じにくくするのに役立つかもしれません。
彼らの仕事を手伝うことで、ライカは彼らの作業効率も向上させることができます。
ただし、それは単に空間に関することではありません。
ライカの経験は地球に戻った人々に教え、インスピレーションを与えることができます。
それは災害、捜索救助活動、またはセラピー支援としてのような異なる状況でも使用されるかもしれません。
ライカは宇宙で最初の動物を称え、人間の創造性と探求の意欲を示しています。
このロボット犬は、宇宙旅行者を支援する新しい章を象徴し、宇宙旅行の体験を変える可能性があります。
それで動画は終わりです。
LeicaというAI搭載ロボット犬について学ぶことが面白かったと思います。
Teslaは、最新かつ最高のプロジェクトであるOptimus Gen-2を発表しました。これは未来的な騎士のような外見のAIヒューマノイドロボットです。
それはほぼ人間のような手の動き、前作よりも軽量化された重量、そして向上した歩行速度を持っています。
このロボットには、複雑なタスクを簡単に実行できるように設計されたカスタムアクチュエータとセンサーも搭載されています。
新しいOptimusとの違いを理解するためには、まず2021年8月にTeslaがAIデーで初めて紹介したオリジナルのOptimusについて話す必要があります。
当時のアイデアは、工場での作業の支援や危険な廃棄物の取り扱いなど、人間が望まないタスクを行うロボットを作ることでした。
当時のOptimusは、実際のロボットよりもロボットの衣装を着た人間のように見えました。
ステージに登場し、手を振ったり、いくつかの簡単な動きをしたりしました。
イーロン・マスクは2022年までに動作するモデルを持っていることを望んでいました。
その後、TeslaはOptimusをより本物のロボットのように見えるようにするために忙しく取り組んできました。
2022年9月、彼らは2つのバージョンを第2回AIデーで披露しました。
1つはバンブルCと名付けられ、とても慎重に歩き、まるで誰かを起こさないようにしているかのようでした。
もう1つは私たちが今知っているOptimusでした。
このバージョンのOptimusは、手の動きがより滑らかで人間らしいものでした。
腕や頭を自分で動かすことができました。
しかし、まだ一人で歩くことはできなかったので、車輪でステージに運ばれなければなりませんでした。
イーロン・マスクは、2023年までにこれらのロボットの実際の製造を始めることを望んでいると述べました。
今のところ、事態は有望に見えています。
しかし、最終版のOptimusについてはまだ多くのことがわかっていません。バランスや制御をどのように管理するか、おそらくTeslaのオートパイロットから技術を使用する可能性もあります。
また、人間との対話能力や新しい環境やタスクに適応する能力についても興味があります。
最後に、Optimusが他のロボットやデバイスとどのようにコミュニケーションを取るかは興味深い問題です。
しかし、あまり深く掘り下げる前に、OptimusGen-2を本当に際立たせるいくつかの主要な技術的特徴に焦点を当てましょう。
このロボットの主要なハイライトはその手です。
これらの手は、11自由度と呼ばれるもののおかげであらゆる方向に動くように設計されています。
この柔軟性により、手はアイテムを拾ったり、道具を使ったりするような正確な作業を行うことができます。
さらに印象的なのは、これらの手が触覚を感知できることです。
これらの手には、損傷なく曲げ伸ばしができる特殊な皮膚のような被覆があります。
この被覆には、圧力、温度、湿度、さらには振動まで感知できるセンサーが詰め込まれており、ロボットの手は非常に感度が高く多様性に富んでいます。
新しいOptimusGen-2ロボットは、その触覚センシングによって本当に先進的です。
これは、他のどのロボットもできない方法で周りのものを感じることができ、何かが熱いか、冷たいか、重いか、軽いか、滑らかか、粗いかを理解することができます。
これにより、より人間らしい方法で相互作用するのに役立ちます。
また、歩く速さも印象的で、時速約4マイルで歩くことができ、自分で頭と首を動かすことができるため、周りを見回したり話したりするのに便利です。
イーロン・マスクは、OptimusGen-2が周りで起こることから学ぶのに十分に賢いと述べています。
新しいものの使い方を理解したり、問題を解決したり、新しい人や動物との会話の仕方を学んだりすることができます。
しかし、Optimus Gen-2の応用はどうでしょうか?
このロボットは人類にどのような利益をもたらすのでしょうか?
このロボットはさまざまな分野で本当に役立つ可能性があります。
まず、製造業では、Optimusを工場での助け手として考えてみてください。
重いものを持ち上げたり、部品を組み立てたり、物が正しく作られているかをチェックしたりするなど、さまざまなことができます。
基本的に、厳しい仕事や退屈な仕事を処理することができます。
建設作業があります。
Optimusは建設現場でゲームチェンジャーになる可能性があり、重いものを持ち上げたり、掘ったり、散らかったものを片付けたりすることができます。
私たちの家やオフィスでは、Optimusが家事をするかサービスを提供することで生活がより簡単になるかもしれません。
それがあなたに物を持ってきたり、掃除をしたり、足をマッサージしたりする姿を想像してみてください。
学校や大学では、Optimusが教師として活躍することもできます。
難しいトピックを説明したり、面白い実験を見せたり、生徒の質問に答えたりすることができます。
楽しみのためには、Optimusが公園や劇場でエンターテイナーとして活躍することもできます。
ゲームをしたり、ジョークを言ったり、歌を歌ったりすることができます。
おい、俺の中に貴重品が入ってるから、気をつけてくれる?
うん、大丈夫だよ。
おい、おい、おい!
LGという有名な電子機器メーカーは、最新作である家庭での生活をより簡単で楽しいものにするために設計された小さくて親しみやすいロボットで、2024年のCESでみんなを驚かせる準備が整っています。
この発表は、たった数時間前に行われたものですが、既にかなりの話題を呼んでいます。
このLGのかわいらしいロボットは約1フィートの高さで、2本の脚で歩きます。
見せ物だけではありません。
この小さな助手は、あなたの家の世話をするために先進技術で満たされています。
家中を歩き回り、問題をチェックし、ペットの様子を見守り、あなたの気持ちを理解して、あなたの日々をより良くするために努力します。
Qualcomm Robotics RB5プラットフォームのおかげで、このロボットは時間とともに賢くなり、あなたの好みや習慣を学んで、さらに良い仲間になります。
LGはこのロボットを移動式のスマートホームハブと呼んでおり、家の周りで行わなければならない家事を減らすことを目指しています。
それはまさにその通りのようです。
来週のCES 2024で展示される予定のこのロボットは、家のすべてのスマートデバイスと接続することができます。
必要ないときや家にいないときにデバイスをオフにすることができます。
さらに、窓が閉まっているか、ライトがついているかをチェックし、それについてアラートを出すことができます。
外出中でも、ロボットはただアイドルで座っているだけではありません。
ペットの様子を見守ることができ、さらには生き生きとした映像を見ることができ、あなたがいない間に毛のある友達が何をしているかを確認することができます。
また、家の温度、湿度、空気の質を監視するだけでなく、何かがうまくいかない場合には警告を出すほど賢いです。
しかし、ロボットの能力はそこで終わりません。
家に帰ると、ドアであなたを迎え、あなたの顔を見て声を聞くことで、あなたがどんな気持ちであるかを理解することができます。
あなたの気分によって、ロボットは音楽や音を再生してあなたを元気づけることができます。
もし薬の服用スケジュールなどを忘れがちな場合、ロボットはそれを思い出させるのに役立ちます。
ロボットにはカメラ、スピーカー、さまざまなセンサーが搭載されています。
これらは、空気の質から潜在的な問題まで、あなたの家で起こっていることを理解するのに役立ちます。
また、音声や画像認識ソフトウェアを使用し、自然言語を処理する能力を備えており、問題が発生した際にそれを特定して対応することができます。
このロボットは、あなたの生活をより簡単にすることを目指すさまざまなスマートホーム製品を導入するLGの大きな計画の一部です。これは、彼らがゼロ労働の家を目指すビジョンに合致しています。
人々が一日中家の中を彼らやペットについて回るロボットに快適に感じるかどうかはまだ見ていません。
LGは来週のCESブースでこのロボットを展示することに興奮していますが、価格や販売開始時期についてはまだ詳細を共有していません。
ロボティクスの分野で革新的な企業であるCovariantは、ChatGPTのようなデジタルツールを動かす高度なAIを使用して、物理環境で動作するロボットを作成しています。
彼らは、この技術を使って、オンラインだけでなく実世界で働いて学ぶことができるロボットを作りたいと考えています。
OpenAIの元研究者3人によって設立されたCovariantは、ロボティクス産業で進歩を遂げており、ソフトウェアの開発を通じてロボットが周囲との観察や相互作用を通じて学習し適応することを可能にしています。これは、チャットボットが膨大なテキストデータのリポジトリから学習する方法と似ています。
カリフォルニア州エメリビルに位置するCovariantは、倉庫や流通センターで使用されるロボットの能力を向上させることに焦点を当てています。
彼らの技術の本質は、ロボットに環境を理解させることにあり、これにより、前例のない洗練度でアイテムのピックアップ、移動、仕分けなどのタスクを実行させることができます。
これらのロボットは、英語を理解する能力を備えており、ChatGPTのようなチャットボットと会話しているかのように、オペレーターが彼らとコミュニケーションを取る可能性を提供しています。
Covariantの革新の中心には、カメラや他のセンサーからの感覚データを、チャットボットのトレーニングに使用されるテキストデータと同様に統合することがあります。
この組み合わせにより、ロボットは周囲の状況を包括的に理解し、明示的にプログラムされていない物や状況を処理する能力を持つようになります。
例えば、Covariantのロボットは、英語で与えられた指示を理解することで、バナナを識別して操作することができます。たとえそれが初めてバナナに出会う場合でも。
この能力は、従来のロボティクスとは大きく異なり、機械が高度に制御された環境で限られたタスクを実行するというものとは異なります。
有望な進歩があるにもかかわらず、Covariantの技術には完全無欠ではありません。
ロボットは時折、指示を誤解したり、物を落としたりするなどのエラーを起こすことがあります。
これらの欠点は、現実世界の複雑さが予測や管理が難しい変数を導入する物理的なタスクにAIを適用する際の課題を浮き彫りにしています。
それでも、Covariantの取り組みは、倉庫から製造工場、そして自律型車両に至る多様な環境で運用可能な、より知的で適応性のあるロボットを作るための重要な一歩を示しています。
Covariantの技術の基盤は、人間の脳の構造に着想を得たAIの一形態であるニューラルネットワークに構築されています。
これらのネットワークは、大規模なデータセットの分析に基づいてパターンを認識し、意思決定を行うことを学習します。
この学習プロセスは、チャットボットや画像生成などのデジタルAIアプリケーションの開発と類似しており、インターネットからの膨大な情報を消化することで内容を理解または作成します。
これらの原則をロボティクスに適用することで、Covariantは機械がデジタルデータと物理世界からの感覚入力から学ぶことを可能にし、デジタルと物理の領域の境界を曖昧にしています。
Covariantの野心的なプロジェクトは、22億ドルの資金調達によって支えられており、業界が彼らのアプローチに対する信頼を強調しています。
同社が物理的なロボット自体よりもソフトウェアの開発に焦点を当てていることは、彼らの技術をさまざまなセクターや種類のロボティックシステムに柔軟に適用することを可能にしています。
この戦略は、ロボティクスの分野での広範な採用と革新の道を開くことを目指しており、ロボットをさまざまなアプリケーションでよりアクセス可能で有用にすることを目指しています。
Covariantの技術の潜在的な影響は広範囲に及び、さまざまな環境でロボットが展開される方法を変革することを約束しています。
ロボットをより適応性があり、複雑な方法で環境を理解し、相互作用する能力を持たせることで、Covariantは、機械がより洗練されたタスクを引き受け、人間と効果的に協力し、新たな課題に適応する未来に貢献しています。
このビジョンは、AIが日常生活に統合される広範なトレンドと一致しており、技術がタスクを自動化するだけでなく、人間の能力と経験を向上させることも目指しています。
Covariantの取り組みは、将来の仕事とロボットの社会における役割について重要な問題を提起しています。
ロボットがより能力があり多目的になるにつれて、現在人間が担っている責任を引き受ける可能性があり、労働市場の変化をもたらし、再教育や教育についての議論が必要となります。
さらに、知的ロボットの開発は、安全性の確保やAIシステムが予測不能な方法で行動する可能性を管理するなど、倫理的な考慮事項を浮き彫りにしています。
Covariantの取り組みは、ロボティクスを通じてAI技術をデジタル世界から物理領域にもたらすことを意味し、その分野において大きな前進を表しています。
感覚データとChatGPTなどのAIシステムを訓練するために使用されるテキストデータを組み合わせることで、Covariantは以前には想像もできなかった方法でロボットが環境を理解し、相互作用することを可能にしています。
課題は残っていますが、この技術が産業を革新し、人間とロボットの協力を強化し、新たな機会を創出する可能性は非常に大きいです。
みなさん、これはついに実現しています。
考えるだけでゲームをプレイしたり、画面上で物を動かしたり、さらにはコンピュータを制御したりすることができる新しい現実があります。
これは遠い夢ではありません。
それは今、イーロン・マスクのNeuralinkで実現しています。
彼らは世界に信じられないと思われるものを見せました。
しかし、それは現実です。人が動かずにインターネットでチェスをプレイする、ただ思考を使って。
これはただかっこいい話だけではなく、全く新しい始まりです。
考えと技術が融合し、私たちが夢見てきたことへの扉を開く場所です。
ここに私たちは立っています。夢とテクノロジー、そして私たちの思考の力がすべてを変える巨大なものの縁に立っています。
画期的な出来事で、Neuralinkは世界中の注目を集め、脳チップを使用してオンラインチェスをプレイする初の患者をライブ配信しました。
その患者、29歳のノーラン・アーボーは、悲劇的なダイビング事故の後、肩より下が麻痺してしまいました。
Neuralinkの革新的な技術のおかげで、彼はただの思考だけでコンピューターカーソルを制御することができ、お気に入りのゲームであるCivilization VIを何時間もプレイするなど、再び様々な活動に参加することができるようになりました。
このライブ配信は、マスクのソーシャルメディアプラットフォームXで放映され、アーボーはNeuralinkデバイスを使ってラップトップ上でチェスゲームを操作している様子が紹介されました。
この技術は、個人が伝統的な物理的インターフェースをバイパスし、思考だけでコンピュータとやり取りすることを可能にすることを目指しています。
マスクは以前、アーボーが1月にNeuralinkチップを埋め込まれ、思考でコンピュータマウスを操作できるようになったと述べていました。
アーボーによると、手術は非常に簡単で、認知機能に影響を受けることなく、翌日には退院できました。
ただし、アーボーとマスクは、この技術がまだ初期段階にあることを誰もが忘れないように迅速に思い起こしています。
アーボーの生活は大幅に改善され、彼が失われたと思っていた活動に参加できるようになりましたが、彼は旅程がまだ続いており、そして立ち上がることは、落下から回復する能力を強調し、産業環境で人間の介入なしで生産性を維持するために不可欠な特徴です。
デザインの選択肢は、ロボットの手にも及び、これまでの4本または5本のより人間らしい指の代わりに、3本の指を備えるようになりました。
この単純化により、機械の複雑さが減少し、繰り返しの産業タスクには欠かせない耐久性が向上します。
ロボットの頭部も再設計され、今では大きな丸いスクリーンが特徴で、友好性を加え、相互作用能力を高めています。これは、プレーターが指摘するように、ロボットがますます人間と共に働く中で重要になるでしょう。
全体的に、新しい電動アトラスは、ハイテク機能とスマートなデザインを組み合わせ、ビジネスや工場の成長するニーズに対応するための大きな前進です。
Boston Dynamicsがこのロボットを改良し続けるにつれて、業界の皆が注目しています。
新機能が実際に現実世界で効率と生産性をどのように向上させるかを見るのが待ち遠しいです。
SanctuaryAIという企業が、なんとMicrosoftとの大規模なコラボレーションを発表しました。それは、汎用ロボット向けの次世代AIモデルの開発を加速することに関するものです。
これは大きなニュースです。
SanctuaryAIに馴染みのない方のために、簡単な概要をお伝えします。
このチームは、汎用ロボットに世界初の人間らしい知能を創造するという野心的な使命に取り組んでいます。
私たちが話しているのは、人工一般知能、またはAGIであり、本当に世界を理解し、人間と同様に世界とやり取りできるAIの究極の目標です。
しかし、ここにはひとつ問題があります。
Sanctuary AIは、ただ大それたことを言っているだけの新興企業ではありません。
このチームには、本格的な経歴があります。
私たちは、D-Waveや最初の商用量子コンピューティング企業であるKindred、革新的な科学の商品化で知られるCreative Destruction Labなど、先駆的な企業の創業者と話しています。
彼らのチームには、Amazon、Microsoft、SoftBank Roboticsなどのテック業界の巨人からのベテランが揃っています。
つまり、これらの方々は、AI、ロボティクス、コンピューティングのいくつかの画期的な革新の最前線にいました。
彼らがAGIの限界を押し広げると大胆な主張をするとき、真剣に受け止めざるを得ません。
このMicrosoftとの協力には、具体的にどのような内容が含まれていますか?
MicrosoftのAzure Cloudの力を利用して、Sanctuary AIがLarge Behavior Models(LBMs)と呼ぶものの開発を加速させることが重要です。
これらは、GPTのような大規模言語モデルを超えた次の進化と考えてください。これは、実世界の経験や相互作用から学習し理解するために設計されたAIシステムです。
Azureの大規模なコンピューティングリソースをトレーニング、推論、ネットワーキング、ストレージに活用することで、Sanctuary AIはこれらの最先端のLBMsの開発において努力を加速させることができます。これらはAGIを達成する道筋上で重要なステップです。
わずか数週間前、Sanctuary AIは彼らの主力ロボットであるPhoenixの第7世代を発表しました。そして、この最新バージョンに詰め込まれたアップグレードと改良は驚くべきものです。
稼働時間の増加、視覚認識の向上、触覚センシングの改善、そして驚くべきことに、手首、手、肘の人間らしい動きの範囲が拡大しています。
このものは、実際の人間の器用さと動きの範囲を模倣するように設計されており、それを考えるとただ狂気だと思います。
ここがすごいところですが、Sanctuary AIは、2023年のTime誌のベストイノベーションの一つである6世代目のPhoenixロボット以来、わずか11ヶ月でこれらの進歩を達成しました。
彼らは本当に速く前進しており、信じられないほどです。
Sanctuary AIのCEOであるジョーディ・ローズによると、この7世代目のPhoenixは、今日利用可能な最も洗練された人間の行動データ収集技術の一つです。
基本的に、これは彼らの炭素AI制御システムに、最高品質で最高忠実度のトレーニングデータを提供しており、それは高度なLBMsの開発とAGIに向けて進む上で重要です。
しかし、もっとも驚くべき統計データは、新しいタスクを自動化するのにかかる時間が、数週間から24時間未満に短縮されたことです。
これは自動化スピードが50倍に向上したことを意味し、自律システムの能力における画期的な瞬間を示しています。
複雑なタスクを1日以内に自動化することを考えると、ただただ驚くばかりです。
製造業、物流業など、さまざまな産業における潜在的な応用は驚くべきものです。
Sanctuary AIは、この第7世代システムが今日利用可能なロボットの中で最も人間に近いアナログであると主張しています。
それは確かに重要な主張ですが、このチームが持つ経歴や実績を考えると、ただ単に一蹴することはできません。
画期的な技術には常に倫理的な考慮事項や潜在的なリスクを慎重に検討する必要があります。
先進的なAIやロボティクスの開発も例外ではなく、安全性、予期せぬ結果、人間の労働に与える影響などに関する懸念が大きくなっています。
Sanctuary AIはこれらの問題を鋭く認識しているようです。
彼らは責任ある開発と、人間の労働を補完する方法に焦点を当てて、人間労働者を置き換えるのではなく支援することを強調しています。
Sanctuaryという名前自体が、商業展開前にAIを責任を持って育てるための管理された安全な環境を伝えるものです。
間違いなく、前進する道は技術的にも非常に困難なものであることを認識しておくべきです。
しかし、SanctuaryAIのような企業と彼らのオールスターチームが、責任ある開発を最優先にしながらこの猛烈なイノベーションのペースを維持できれば、私たちは今後数年で本当に驚くべき飛躍を目撃するかもしれません。
人間のような人工知能によって動力を得た普遍的で多目的なロボットアシスタントの時代が目前に迫っており、このような先見の明のある先駆者や強力なパートナーシップによってリードされる未来は、私たち誰もが想像できた以上に近いかもしれません。
Unitreeは、新しいUnitree G1ヒューマノイドロボットのトレーラーを公開しましたが、これは驚くべきものです。
このロボットの柔軟性、熟練度、そして全体的な能力は本当に素晴らしいものです。
なぜこのロボットがゲームチェンジャーなのか、正確に説明してお見せします。
ここには解明すべきことがたくさんあり、このロボットは本当に革命的です。
まず、最初に、最近Boston Dynamicsが発表したアトラスロボットに少し似ていると気づいたかもしれません。
私はユニツリーがそのトレーラーが公開されてからたった3週間でこのロボットを作成したとは思いません。
こうしたものを開発するには長い時間がかかります。
しかし、示されていることは、ユニツリーが多くの人々が予想していたよりも速く進化しているということです。
彼らは比較的手頃な価格でいくつかの本当に印象的なテクノロジーを提供しています。
G1はたった16,000ドルから始まりますが、これはこの種の能力を持つ他のどのヒューマノイドロボットよりも安いです。
このデモで私に本当に目を引いたのは、狂気的な柔軟性と動きの幅でした。
ここでご覧の通り、このロボットは人間が簡単にはできないような方法で回転することができ、その脚はより広い動き範囲を持っています。
彼らはまた、中空関節技術を使用して配線を内部化することに成功し、より効率的な動きとよりコンパクトな設計を可能にしています。
このトレーラーは本当にロボット競争が進行中であることを強調しています。
誰もがUnitreeがこんなに早く何かをリリースするとは予想していなかったと思います。
私は最初にBoston Dynamicsのような企業から出ると予想していました。
Boston Dynamicsは油圧アクチュエーターまたは完全に電気式のシステムを使用しているかもしれませんが、G1の動きの能力は、私たちがまだ考えていないかもしれない多くのタスクを処理できると示唆しています。
もう一つ、私を本当に感動させたことは、ロボットが衝撃を受ける際の安定性でした。
私はロボットを殴るべきだとは言っていません。
彼らが私たちに反抗することを決定した場合、それはうまくいかないかもしれません。
しかし、全ての真剣さの中で、このロボットが胸部に強い衝撃を受けても完全に安定したままでいられるという事実は、驚くべき工学的偉業です。
現実世界のアプリケーションでは、ロボットは風やゴミ、予期せぬ衝突などに遭遇する可能性があり、そのような状況で立ち続けて機能し続けることが非常に重要です。
ほとんどの人間は、そのようなパンチを受けると地面に倒れるでしょうが、これは本当に興奮する進歩です。
以前、UnitreeのH1ロボットで安定性の類似したデモンストレーションを見てきました。
しかし、G1はそれを全く新しいレベルに引き上げています。
市場にあるほとんどの他のヒューマノイドロボットでこれを試すと、彼らは瞬時に倒れてしまいます。
ユニツリーが外部の支持ケーブルを使用せずにこの安定性のレベルを達成している事実は驚くべきことです。
通常、この種のロボティクスのデモでは、バランスが初期開発段階で最大の課題の1つであるため、ロボットが天井につながれるなどして転倒を防ぐことがあります。
しかし、ユニツリーは、全ての配線を内部に隠して、打撃を受けても立ち続けるロボットを作り出しました。
それは莫大な業績です。
G1のスピードも非常に印象的です。
それは、Unitreeの以前のロボットが設定した世界記録にほんの少し及ばない、最大3.3メートル毎秒の速度に達することができます。
文脈を考えると、それはおおよそ2メートル毎秒であり、ほぼ走る速さです。
他の人型ロボティクス企業からは、それに匹敵するものを見たことがありません。
例えば、Teslaのロボットはかなりスムーズに歩くことができますが、このように速くは動きません。
安定性をテストするために誰かに蹴られることを望んでいるとは思えません。
全体的な性能に関しては、Unitree G1は現在最高のヒューマノイドロボットの1つであると主張したいと思います。
私を驚かせたことの1つは、ロボットがシミュレーションを通じてタスクを学習し、それを実世界で適用できる能力でした。
模倣と強化学習を使用して、彼らはNVIDIAのIsaac Simのようなシミュレート環境でロボットを複雑なアクションを実行するように訓練し、それらのスキルを物理的なロボットに移すことができます。
動かしてみると、関節の動きがどれほど正確で微妙かがわかり、これらのタスクを自律的に実行しながらバランスを保つことができる事実は驚くべきです。
これは、ロボティクス研究にとって大きな意味を持ちます。なぜなら、これまでほとんどのヒューマノイドプラットフォームが非常に高価であり、多くの研究室や大学にとってアクセスが困難だったからです。
例えば、Unitree H1は優れた研究プラットフォームでしたが、その高いコストが大きな障壁となっていました。
G1がより低価格で登場することで、多くの人々がこのテクノロジーを手に入れ、可能性の限界を押し広げることができるでしょう。
それがその手です。
以前のUnitreeロボットは器用な操作装置の不足が批判されていましたが、G1には信じられないほど精密に物をつかんだり操作したりすることができる手があります。
くるみを砕いたり、パンの一切れをひっくり返したり、さらには簡単にソーダ缶を開けたりすることができます。
ここで展示されている制御レベルと微細運動スキルのレベルは、まさに狂気です。
彼らはまた、Unitree Robot Unified Large Modelというものについて言及していますが、これはロボットがこれらのタスクを自律的に実行することを可能にする何らかのAIシステムのようです。
詳細はまだあまり明らかになっていませんが、おそらくこれは、シミュレーションされたデータと現実のインタラクションの大量のデータセットで訓練された機械学習モデルです。
情報が入手可能になると、皆さんに必ず更新します。
彼らが示す他の重要な点の1つは、ロボットが電子部品をはんだ付けするなど、非常に正確な動きを行う能力です。
これは製造や組み立てのような分野での潜在的な応用範囲を全く新しいものにします。
しかし、G1の最も興奮する点は、その価格です。
ベースモデルでわずか16,000ドルで、これは以前のユニトリーの人型ロボットの約150,000ドルと比べてほぼ10倍も安いです。
これは手ごろな価格への大きな飛躍であり、この技術をより広範囲の研究者や開発者にアクセス可能にします。
私たちはすでに、人々がUnitreeのH1プラットフォームで行っている素晴らしいことの一部を見てきました。
例えば、上海科技大学とMarslabの研究者は最近、ヒューマノイドパルクール学習のためのフレームワークを発表しました。このフレームワークにより、ロボットは視覚と固有感覚だけを使用して、荒れた地形を移動し、高いプラットフォームに飛び乗り、障害物を飛び越えるなどが可能となります。
これは、ロボティクスの分野での大きな成果である完全なエンドツーエンドシステムです。
問題は、多くの学術研究室がこの種の研究のための資金調達に苦労していることです。なぜなら、彼らは単純に高価なハードウェアを買う余裕がないからです。
しかし、G1が登場することで、新しいプロジェクトや発見が爆発的に増えるでしょう。
H1はフルバックフリップができました。これは、そんな基本的なアクチュエータを持つロボットにとっては驚くべきことです。
Unitree G1の高度な機能を使って人々が何をするか想像してみてください。
要するに、Unitree G1はまさにゲームチェンジャーです。
柔軟性、安定性、器用さ、手頃さの組み合わせは類を見ないものであり、ロボティクスの分野で新たな可能性を切り拓くことになるでしょう。
このプラットフォームが数ヶ月後に出荷されると、研究者や開発者が何をするかを見るのが待ちきれません。
ロボティクス競争が激化しており、Unitreeは中国が世界舞台で真剣な競争相手であることを示しています。
彼らは信じられないほどの速さで革新し、この技術を他の誰もが行ったことのない方法で利用可能にしています。
Unitreeに注目してください。
私は彼らから非常に近い将来にさらなる画期的な発展をたくさん見ることになる予感がします。
アラブ首長国連邦から興味深いニュースがあります。
この発表はアブダビのテクノロジーイノベーション研究所、通称TIIからのものです。
彼らは、印象的な2つのモデル、Falcon 211BとFalcon 211B-VLMを特集したFalcon 2シリーズを発売しました。
Falcon 211Bは、彼らが言うように、人間らしいテキストを理解し生成するために設計された超強力なテキストベースのAIです。
一方、Falcon 211B-VLMはビジョン・トゥ・ランゲージ・モデルです。
これは、画像を取得し、それについての詳細なテキスト説明を生成することができることを意味します。
なぜUAEがAIで大きな動きをしているのかについて話しましょう。
UAEは広大な石油埋蔵量で知られており、現在は人工知能への大規模な投資を行っています。
この変化は見過ごされていません。
実際、昨年、米国の役人たちは、UAEに対してアメリカと中国のテクノロジーの間で選択を迫る強い最後通告を出しました。
これに応じて、エミレーティのAI企業であるG42は中国企業との関係を断ち切り、Microsoftから150億ドルもの巨額投資を受ける道を開きました。
この戦略的な転換は、ワシントンと注意深く調整され、UAEがAI分野での進歩に真剣に取り組んでいることを示しています。
Falcon 2のリリースは、世界中の国や企業が独自の大規模言語モデルを開発する競争が続く中で行われています。
一部の企業はAI技術を独自のものとして保持していますが、UAEのFalconやMetaのLLaMAのように、他の企業はオープンソース化しています。
将来を見据えると、UAEのAIへの大規模な投資は、同国を世界のテクノロジー分野で重要なプレーヤーとして位置付けています。
Falcon 2シリーズはたったの始まりであり、予想されるFalcon 3はすでに進行中です。
Robot Eraという企業が新しいAIヒューマノイドロボットを発表し、それはかなり驚くべきものです。
このロボット、X-Handと呼ばれるものは、具現化されたAIの世界で画期的な存在のようです。
具現化されたAIとは、人間と同様に現実世界とやり取りできるロボットを作ることであり、このX-Handロボットは次のレベルに進化しているようです。
このロボットは12のアクティブな自由度を持ち、人間の身体と同様にさまざまな方法で動いたり曲げたりすることができます。
また、内蔵された触覚センサーがあり、触れたものを実際に感じたり感知したりすることができます。
制御精度は非常に高く、滑らかで信頼性のある動きが可能だとされています。
しかし、ここがポイントです。ロボットエラは、X-Handの背後にある技術が完全に自社開発されたものであると主張しています。これは、比較的新しいプレーヤーであるロボティクスとAIの分野において非常に印象的です。
彼らは2023年に設立されたばかりですが、すでに可能な限りの限界に挑戦しています。
このロボットがいくらするか、一般にいつ利用可能になるかはわかりません。なぜなら、Robot Eraは現時点ではそれらの詳細を秘密にしているからです。
しかし、彼らが私たちに示してくれたものから見ると、X-HandはAIを具現化するために特別に設計されているようで、AGIの達成に近づくにつれて大きな影響を与えるかもしれません。
AGIについて話すと、最近それが近いうちに起こる可能性について多くの興奮がありました。
冗談ではありません。
一部の専門家は、この分野での飛躍が間近に迫っているかもしれないと言っています。
Robot Eraについてもう少し話しましょう。彼らが取り組んでいることについて。
彼らは、かなり野心的な一般用途のヒューマノイドロボットの開発に焦点を当てています。
彼らの主要なプロジェクトの1つは、Humanoid Gymと呼ばれ、強化学習を使用して、ロボットが人間の能力を模倣する方法でタスクを実行するように訓練することです。
彼らは、Zero-Shot Sim to Real Transferというクールなコンセプトを使用しています。基本的には、彼らはまずシミュレート環境でロボットを訓練し、追加の訓練なしに実世界で展開することができます。
でも、私からの話はこれくらいにしておきましょう。
実際にX-Handロボットを見て、本当に何ができるのかを見てみましょう。
Robot Eraはショーケースビデオを公開しており、彼らがデモンストレーションしている能力はかなり魅力的だと言わざるを得ません。
その映像を再生して、このすごいやつが何ができるのかを見てみましょう。
しばらく前に、野心的なスタートアップであるRobot Eraが発表した、彼らのクレイジーな器用なX-Hand AIロボットを取り上げたことを覚えているかもしれません。
彼らは、中国の万里の長城を歩くフルサイズの人型ロボットを持つ初の企業として、大きな進歩を遂げました。
彼らの最新のロボット、X-Bot Lという名前のものは、世界で最も象徴的で挑戦的な風景の1つである、中国の万里の長城の古代の石の道や急な階段を制覇しました。
これは、Robot Eraだけでなく、人型ロボティクス全体にとっても大きな節目です。
身長165cmの5'5のロボットは、スリムなターミネーターのように見え、その不均一で100年以上前の石の表面を躊躇することなく進んでいきました。
挨拶をしているし、カンフーの動きを練習しているし、階段を上り下りしているし、全てをやっていました。
正直に言うと、万里の長城は、私たち人間にとっても簡単なものではありません。
その道はひび割れており、階段は手すりのない急なもので、ランダムにどこにでも穴があります。
二足歩行ロボットをつまずかせるように設計された障害コースですが、X-Bot Lは、Roboterraの高度な知覚強化学習アルゴリズムのおかげで驚くほど簡単に対処しました。
基本的に、このロボットはセンサーとAIを使用して環境をリアルタイムで認識し、理解することができるのです。
それは障害物や地形の変化を識別し、文字通りその場で歩行の歩幅やバランスを適応させて、万里の長城が投げかける何事にも対処できるようにします。
共同創設者の一人であるイエ・シーによると、彼らの洞察力のある強化学習技術は、X-Bot Lに人間レベルの認識と意思決定能力を未知の環境で提供しています。
そのロボットは、複雑なエリアを安全かつ効率的に航行する最良の方法について、基本的に自己判断できます。
ここでは単なる基本的なプリプログラムされた動作について話しているわけではありません。
X-Bot Lは険しい城の階段を登り、斜面や傾斜に対処し、照明条件の悪化に適応し、すべて人間のガイダンスや助けなしで行っていました。
それは基本的に、私たちが人々に関連付ける適応的で知的で状況を把握した動きを実現することでした。
Roboterraは、これが最大の課題の1つであり、ロボットのセンサーから得られたデータを正確で安定した運動に変換するエンドツーエンドのAIアルゴリズムを開発することで、グレートウォールのような超複雑な環境で実世界での移動を実現しました。
このデモに基づいて、彼らはその難題をクリアしたようです。
本当に驚くべきことは、このグレートウォールの偉業が、以前に言及したX-Hand Dextrousロボットを披露した数週間後に行われたことです。
これら2つの製品の間で、Roboterraは具体的なAIに全力を注いでおり、人間のような身体能力を持つロボットを構築して、私たちの世界で運用しています。
彼らも冗談ではありません。
2023年に設立されたばかりですが、強化学習、ニューラルネットワーク、シミュレーションから実世界への転送など、最先端のAI技術に大規模な投資を既に行っています。
私たちと同様に現実世界で対処できるロボットを作成するために必要なすべてが揃っています。
彼らの目標は、よりスマートで能力の高いヒューマノイドロボット製品を迅速に繰り返し生産し、競争力を維持することのようです。
彼らは、シミュレーションから物理的な機械にAIトレーニングをすべて転送する方法を磨き続け、これらのロボットが実生活のシナリオでより多目的になるようにしたいと考えています。
エンドゲームは、製造、医療、サービスなどの産業において、数え切れないほどの貴重な用途に向けて、超柔軟で汎用性のある人型ロボットを開発することのようです。
Roboteraには賞賛を送らねばなりません。
彼らのロボットをわざと極限のストレステストとして万里の長城に送り込むことは、彼らのテクノロジーに対する真剣な自信を示しています。
ほとんどの企業は、新製品にそんなにリスクの高いことを避けるでしょうが、X-Bot Lがそれをとてもスムーズにこなせた事実は本当に印象的です。
これは、彼らの具現化されたAIアプローチと洞察力のある強化学習システムが、最も厳しい現実世界の環境の1つでうまく機能していることの素晴らしい概念証明です。
私にとって、これはロボテラがロボティクス、人工知能、メカトロニクスなどの分野で優れたコア能力を示していることを示しています。
彼らは、具体的な知能において先駆的であり、それを実世界で信頼性を持って機能させる点で明らかに最先端に位置しています。
私は本当に、ロボテラが次に出てくるどんなクレイジーなロボットにも期待しています。
彼らがこのように基準を高く保ち続ければ、我々の世界で前例のないレベルで自律的に運用できる先進的な人間のようなロボットの時代を正当に導入するのに役立つかもしれません。
我々は、人工一般知能(AGI)が数年以内に現実のものとなる大きなブレークスルーの瀬戸際にいる可能性があり、将来のAGIを収容し具現化するための物理的なロボットボディを構築できるのは、ロボテラのような野心的な小さな先駆者かもしれません。
AGIのような超高度なAIシステムを開発する場合、OpenAIでの内部告発者の状況は、賭けが実際にどれだけ高いかを示しています。
ロボテラのロボットが万里の長城で達成したことは、具体的なAIの観点から間違いなく印象的ですが、人間の認知と同じレベルの一般的な人工知能を作成することが社会に与える影響(肯定的、否定的の両方)と比較すると、そのような成果は小さく見える可能性があります。
一方で、AGIは未解決の科学的謎から世界的な危機まで、人類が直面している無数の課題を解決するのに役立つ可能性がある、驚異的な技術的突破口を表しています。
人間の知性に匹敵する一般的なAIの心は、あらゆる分野で変革的な進歩の触媒となる可能性があると常に見なされてきました。
しかし一方で、人間よりも賢い未調整の超知能AGIの存在リスクは、単に過大評価できません。
私たちは、高度なAIシステムが安全かつ責任を持って開発されない場合、人類や地球に壊滅的な影響をもたらす可能性について話しています。
OpenAIの内部関係者は、この具体的なシナリオが実現することについて警鐘を鳴らしています。
彼らは、競争的な圧力よりも正しい方法で行うよりも先になることを追求することによって、適切な安全対策を講じずにAGIの支配を無謀に追求していると主張しています。
OpenAIが自らの安全審査プロセスを無視し、従業員を非常に厳しい非難禁止契約で口封じし、創設メンバーが懸念を表明した後に安全作業を優先度を下げているという非難は、非常に心配な状況を描いています。
もしこれが真実であれば、主要なAI研究所の1つがAGIの存続に関するレースで非常に危険で倫理的に問題のあるアプローチを取っていることを示唆しています。
尊敬される研究者であるイリヤ・スツケヴァー氏が、OpenAIがAGIの安全性と整合性を保つことへの取り組みが不十分だと感じて辞任せざるを得なかったという事実は、告発者の不満に更なる信憑性を加えると私は考えています。
彼らが透明性の向上、従業員の保護、そして最終的には政府によるこの強力な技術の規制を求める手紙は、潜在的な災害シナリオを防ぐためには合理的であり、おそらく必要な一歩のように感じます。
なぜなら、現実的に考えてみてください。
初めて現れる超知能AGIが人間の倫理や価値観と致命的に整合しない状況を許す余裕はありません。
自制を行使し、責任ある開発を優先することが最優先事項でなければなりません。
告発者たちは、彼らの哲学的見解や効果的利他主義運動との関係から、ある程度の偏見を持っている可能性がありますので、個人的には中立的な立場を取ることをお勧めします。
しかし、その偏見を考慮しても、AGIにかかわるリスクの巨大さは、確かに安全対策と倫理的な枠組みを競争的な圧力やOpenAIのような企業の商業的利益よりも優先する強いコミットメントを正当化しています。新興のAGIを適切に整合させないことは、人類の文明を修復不能に混乱させるリスクを冒す可能性があります。
これらの懸念を軽視して先を競う私的な組織は、本質的に人類の未来に対して潜在的な絶滅レベルのロシアンルーレットを行っていると言えます。
Roboterraのような企業からの最先端のAIやロボティクスのブレークスルーに感銘を受けていますが、OpenAIの告発者がこれらの存立リスクについての警告を真剣に受け止めていることを、研究者、経営者、政策立案者、その他のAIコミュニティ全体が同様に真剣に受け止めていることを願っています。なぜなら、我々はAGIを制御された責任ある方法で開発するために一度きりのチャンスしかないかもしれず、このゲームチェンジングな技術が人類が繁栄するための資産となるようにし、我々の潜在的な没落の引き金となる意図しない触媒となることを防ぐことを確実にする必要があるからです。
リスクは非常に高いのです。
もっと更新情報を受け取るために、購読ボタンを押さないでください。
お聞きいただきありがとうございます。次回もお楽しみにしてください。