この週、OpenAIの新しいビデオ生成モデル「Sora」に関する話題が注目を集めましたが、その背景では他にも驚くべきAIの進展がありました。イーロン・マスク氏はXのライブスペースでお話しになり、AGI(汎用人工知能)と私たちが仮想世界に生きている可能性について述べられました。彼は、AGIが新しい物理法則を提案できる可能性があると提案し、これはシミュレーション説を支持する証拠となるかもしれません。さらに、AIが現実世界のシミュレーションで訓練され、それが現実世界に適用できるかもしれないというアイデアも議論されました。NVIDIAの研究者は、AIが異なる現実を横断できる「基盤エージェント」の概念を紹介しました。一方、Googleは新しいオープンモデル「Gemma」をリリースし、スタンフォード医学は性別による脳の構造差をAIで識別する研究を発表しました。最後に、AIハードウェアスタートアップGroqは、高速かつ低コストのAIチップを開発し、AIの進化に新たな可能性を示唆しました。
公開日:2024年2月22日
※動画を再生してから読むのがオススメです。
今週全体を通じて、OpenAIの新しい驚くべきビデオ生成モデルであるSoraについて話してきましたが、裏で起こっている狂気のAIニュースがたくさんありました。
しかし最初に、これから始めましょう。
イーロン・マスクがTwitter/Xでライブスペースの会話に参加し、ここでイーロン・マスクがAGIと交差することを説明し、我々が実際にシミュレーションの中に生きているかどうかを見極めるのに役立つかもしれないと述べています。
そして、その間、彼の子供の一人が彼の頭の上に登ろうとしていると思います。
私はもう一つのチューリング・テストを提案できるかどうか疑問に思っています。つまり、AGIの異なる定義であり、物理学の新しい法則や物理学の基本的な現実のレイヤーではなく、新しい完全な物理学のパラダイムを実際に考え出すことです。
つまり、あなたはいつもそれを引用しているんですよね?
まあ、確かにAIは自分がシミュレーションであるとは気づかないと思います。
それが現在の私たちに当てはまるかもしれません。
そして、それは真の物理エンジンを持ち、したがって同じように感覚を経験するでしょう。
シミュレーションスタイルのプロセスは、何かを見るときに確率分布が崩壊するという、量子力学のいくつかの要素を説明します。
例えば、何故何かが見られた時だけ真実になるのでしょうか?
もしリアルタイムでレンダリングされているなら、それが実際にビデオゲームが動作する方法です。
例えば、あなたがWorld of Warcraftなどにいて、森を歩いていてネズミが現れたとします。
しかし、その前に、ネズミはいたのかいなかったのか?
ネズミの確率しかなく、ネズミはあなたがその方向を見たときにのみ現実のものとなり、確率空間が崩壊し、ネズミが現れました。
私は、バージョン理論が実際にはシュレーディンガーの猫の状況のようにかなり神秘的に思える多くのことを説明していると思います。
宇宙は私たちには無限に見えるかもしれませんが、率直に言って、もしこの現実のシミュレーションを作成するなら、私は星を十分に遠くに配置するでしょう。私たちが惑星の詳細をシミュレートする必要がないように。
実際、それがその状況です。
本当に私たちの惑星で観察されるものを高い忠実度でシミュレートする必要があります。
それは2倍低い現実よりもはるかに簡単なタスクです。
私はジェームズ・ウェッブ望遠鏡が発射されたときに冗談を言っていました。おそらく遅れの理由は、シミュレーターがより多くのコンピュータをオンラインにする必要があったからで、今、より遠くを見ることができるようになったので、彼らはシミュレーションの忠実度を向上させる必要があったのです。
まるでAmazon Web Servicesのようなものです。
イーロン・マスクとニール・ド・グラス・タイソンの間で興味深いやり取りがあります。
これがこの人です。
彼はイーロン・マスクが提示したアイデアについて話しています。
私はかつてフォーラムでそれを見たことがあります。誰かが彼に質問をしたとき、そのアイデアは基本的に次のようなものです。
つまり、何かが存在すると想像してください。それが基本的な現実と呼ばれるものです。
これは元の物理的な宇宙です。
そして、最終的には、科学の進歩やコンピュータ、計算能力が十分になり、自分たち自身の宇宙やそれに類似したもののシミュレーションを作成することができます。
そして、それを作成し、このものは進化して最終的には自分自身の宇宙のシミュレーションを作成するまで進化し、それが永遠に続いていきます。
その世界が進化し、計算能力を発展させるようになったのです。
はい。
そして、彼らはビデオゲームをしたいと言います。
だから、私たちは世界を作ることになります。
そして、彼らは世界を作ります
そして、下まで世界を作ります。
はい。
数百、数千、数十億、無限かもしれません。
イーロン・マスクの質問は、私たちがこの基本の現実に生きている可能性は何%かということでした。
私は、ニール・ド・グラス・タイソンが説明したように、このものが永遠に広がっていると想像できるなら、基本的には、私たちが実際に基本の現実にいる可能性は、100万分の1、1兆分の1、あるいは何か天文学的に大きな数の中の1つであるということです。
OK。
1つはゼロに近い、あなたが本当の宇宙であり、999ゼロに対して1つです。
それがあなたのシミュレーションです。
私を納得させました。
そして、それがイーロン・マスクの指摘で、非シミュレートされた世界に住んでいる可能性は非常に低いということです。
はい。
もしこの考えをある程度追っているなら。
そして私は説得されたくありません。
私はそれが好きではありませんでした。
しかし、ニールはその考えが好きではないと言いました。
そして、実際に彼はその理由を説明しようとするために多くの時間を費やしました。
そして、彼は成功しました。
基本的に、この考え方は、これらすべての宇宙が共通して持っているのは、それらが進化してシミュレートされた宇宙を持っているということです。
つまり、どこかの研究室で、その宇宙の中にある宇宙全体のシミュレーションを実行しているコンピュータがあるということです。
私たちは現在、私たちが知っている限り、そうではないので、それは私たちがこの連鎖の最後の宇宙に住んでいるか、まだ自分自身のサブリアリティサブユニバースを開発していない最後の宇宙であることを意味します。
私たちは私たちの上に複数の宇宙があるかもしれません、またはたった1つ、元の基本層、基本現実、または私たちは基本現実です。
私たちは唯一の宇宙です。
もしもそう考えるなら、私たちがシミュレートされた現実の中に住んでいる可能性は、非常に低い確率から、つまり、50対50になります。
はい。
この長い連鎖の底にいるか、または基本現実にいるか、50対50です。
それらははるかに良い確率です。
どちらかと言えば、私たちが本物です。
そうですね。
あるいは、私たちはまだ進化し続けている連鎖の中の1つです。
ですから、シミュレーションである可能性は、1対数十億から、50対50に変わります。
まあ、それでいいですね。
ただし、今や私たちは世界全体のシミュレーターを構築できるかもしれない時期に急速に近づいています。
OpenAIがそのことを話しています。
NVIDIAもそのことを話しています。
こちらはNVIDIAのAI研究者であるジム・ファン博士ですが、究極のAI/ロボットが、ある種の基盤エージェントであり、異なる現実を横断して一般化することができるように話しています。
彼らはシミュレーションで訓練され、それが現実世界に翻訳されることができます。
彼らはどんな形や姿でも取ることができるでしょう。
彼らはシミュレーションと現実の間をシームレスに移動できるようになるでしょう。
彼が言うように、もしもこのロボットが10,000の異なるシミュレーションを移動できると想像すると、10,001番目のシミュレーションが私たちの現実であると考えることができます。
そのエージェントにとっては、それはただの別の火曜日であり、横断できた別の現実に過ぎません。
アイザック・ジムでこのロボットのトレーニングを見ているのがこれです。
そしてそのロボットの車輪のようなものがそれを現実世界に一般化できるようになっています。
シミュレーションで学んだすべてのスキルが、ほぼそのまま現実世界に翻訳されます。
数年前にさかのぼると、実際の世界がシミュレートされた世界を作り出すというアイデアについて人々が話していたことが面白いです。
そして、5年以上前には、人々は、このシミュレートされた世界を作成する目的は何だろうと疑問に思っていましたね。
このシミュレーションを実行しているものは、私たちにすべてを与えてくれます。
それは私たちに生命と宇宙、すべてを与えてくれるのですね。
でも、なぜでしょうか?
そして、人々は疑問に思い、過去や歴史の中でどのように事が展開するかを見たかったのかもしれないと言ったりします。
あるいは、リック・アンド・モーティでは、そのシミュレートされた宇宙は基本的に車のバッテリーとして存在していました。
その中の人々は、基本的にその男の車を走らせるためにエネルギーを生成する存在でした。
ポイントは、5年前、シミュレーションが実際の世界にとってどのように有用かを本当に知らなかった、今ではわかってきています。
それは非常に明らかになっています。
その理由はデータです。
このシミュレーションで回転するペンを習得するロボットの手は、私たちにとって非常に役立ちます。
何百万ものロボットがそこに座って、ペンを回したり歩き方を学んだりボールをジャグリングしたりすることは、非常に役立つのです。なぜなら、それは私たちにデータを提供し、それを抽出して実世界で使用できるからです。
もし私たちの推測が正しいとすれば、SoraがUnreal Engineを使用して、おそらくこのデータの一部を生成し、そのモデルのトレーニングに使用した方法について、それはある種のシミュレーションの例になるでしょう。この場合、このAIモデルのためにデータを生成するために使用される3Dシミュレーションの一例です。
これは理解するのが重要なことです。なぜなら、ここ5年ほどで、シミュレーションを実行するという私たちの認識が、単なる面白いものから、お金を生むものに変わったからです。
それは科学です。
それは役に立つかもしれません。
うーん。
面白いですね。
今では、それはお金です。
お金です。
それは新しい黄金です。なぜなら、それはデータを生み出すからです。
データは新しい石油であり、さまざまなシミュレーションは油田です。
Unreal Engineはビデオエンジンのためにデータを生成します。
シミュレーションで箱を拾ってカートに入れるロボットは、それを実際に行うことができる実際のロボットに変換されます。
Amazonのような企業が、このようなものを持つことでどれだけ恩恵を受けるか考えてみてください。つまり、手には車輪が付いていないかもしれませんが、アイデアはわかりますよね。
ロボットは、どんな地形でもナビゲートし、箱を拾うことができるこの種の器用で移動可能なロボットは、非常に役立つかもしれません。
おそらく、さまざまな異なる用途に役立つ可能性があります。
そして、この企業は、巨大な軍事および民間の用途を持つ次世代のロボットについて、間近に特許承認を待っています。
今、今、あなたのリスナー、この株は10セントで店頭で取引されていますが、あなたは、はい、すみません、最後の部分は私がでっち上げたものです。
しかし、ポイントは、NVIDIAはシミュレーションを前進させるために多くのことを行っています。
誰がそれらを使うのですか?
研究者、エンジニア、アナリスト。
それらは、気象パターンを予測し、さまざまな病気の広がりをシミュレートし、金融モデルを加速し、エンジニアリングシミュレーションを高速化し、自動運転車などに使用されています。
彼らはどこかにビデオがあり、BMW工場全体をシミュレートしており、生産ラインや労働者を含んでいます。
そして、労働者が機械に近づくシーンがあり、彼がけがをする様子が示されていますが、グラフィック的ではなく、彼をクリップし、赤く点滅させることで、これは危険な状況であることを示しています。
このBMWの工場の3Dシミュレーション、車の生産工場のシミュレーションは、周囲を走り回る人々とともに完全にシミュレートされます。
そして、すべてのバグが取り除かれたら、そのデータは取り出されます。
それから、その仕様書に基づいて実際の現実世界の工場が建設されました。
生成エージェントは一種のシミュレーションでした。
それは3Dではなく、かなりシンプルでしたが、基本的に各キャラクターは独自のGPT、ChatGPTであり、周りを走り回り、友達を作り、決定を下していました。
そして、彼らの行動は非常に生き生きとしており、非常に信じられるものであり、ゲームをプレイしている人間プレイヤーよりもそうでした。
私の言いたいことは、ますます高度なシミュレーションがより複雑な詳細を持つようになる可能性が高いということです。
つまり、これらのロボットのシミュレーションの中には、さまざまな付属物を通る電流をシミュレートしているものもあり、ロボットの異なる腕に異なる摩擦、異なる電流が流れるかもしれません。
現実世界で起こりうるさまざまな不一致や潜在的な違い、摩擦の異なるレベル、異なる風などをシミュレートしています。
これらのディープマインド、サッカーをするロボット、それが話していたのは、まず、これらのロボットを作成できるということで、これらのことはすべて教えられたものではありませんでした。
彼らがどのようにプレイするかは、シミュレーションで100%学習されたもので、まるでこれのように見えます。
彼らはさまざまなことをどうやって行うかを見つけ出します。
そして、さまざまな力の機能の変化によって、シミュレーションから出てきたときに、さまざまなことがうまくいかない小さなことに対してより堅牢になります。
彼らは、必要に応じて、逆境に対処する能力が向上しています。
だから、いつかは現実の部分をシミュレートすることも、おそらく、いつかは現実全体に近いものを模倣することもあるかもしれません。
そして、私たちが基本的な現実の中に住んでいるのか、シミュレーションの中の1つに住んでいるのか、それはただの思考実験です。
私はこのことをあまり真剣に受け取らないでしょう。
しかし、この二重スリット実験はとても奇妙です。なぜなら、私たちの現実の一部が、私たちがそれを見ている、何らかの方法で測定しているときまでレンダリングされないように思えるからです。
そして、2023年4月に発表された新しい研究では、二重スリット実験が空間だけでなく時間にも当てはまることが示されています。
でも、おそらく何もないでしょう。
その他のニュースでは、AIハードウェアの新興企業である「Groq(グロック)」が、推論を実行するための非常に高速で手頃な価格のAIチップを開発しました。
そこで、彼らはこれらのLPUアーキテクチャ、言語処理ユニット、新しいワークロード向けの新しいプロセッサクラスを持っています。
そして、それをgroq.comでテストすることができます。速いです。
非常に、非常に速いです。
こちらがプロンプトです。旅行するAGIセールスマンについての短編小説を作成してください。
そして、そこに行きます。
それは3.2秒でした。
そして、ここではオープンソースモデルMixtrelを実行しています。
おそらく、Groqについて詳しく調査する必要があるかもしれませんが、この時点では、AIチップ市場にもう1つ非常に興味深く、非常に強力な競合他社があるようです。
おそらく、自分自身の得意分野を持つことになるでしょう。
こちらが創業者の1人との簡単なインタビューです。
人工知能に関する議論が行われると、ここで、巨大なホールがハッキングされます。
世界初の言語処理ユニットであり、例えばMetaのLLaMA 2モデルのようなプログラムを世界で最速で実行できるものです。
10〜100倍速いです。
それがGroqで、Qをつけて綴ります。それはSF小説から来ており、何かを深く共感を持って理解することを意味します。
もちろんです。
私たちの中にはすべての偉大な知識人がいます。
あなたのお話は何ですか?
ほとんどのチップには中に十分なメモリがありません。
それから、組み立てラインの一部を設定し、何度も壊す必要があります。
そうですね。
そして、それは遅くて多くの時間がかかります。
そして、それがGPUで起こることです。
そのメモリから読み取る必要があります。
出てくる単語ごとに何千回も、まるで組み立てラインを何度も設定しているかのようです。
こんにちは、私はGroqです。
私には人間と話すように話してもらえます。
わかりました。
します。
過去に使用した可能性のある大規模言語モデルとの違いは何ですか?
もちろん。
私は、以前に使われていた大規模な言語モデルとは少し違います。
私は、より自然なコミュニケーションを持つように設計された言語ユーザーインターフェース、またはルイと呼ばれています。
了解しました。
あなたは人間の脳とどれくらい似ていますか?
まあ、私は人間の脳ではありませんが、人間のように理解し、応答するように設計されています。
私が知りたいのは、彼女がドバイのど真ん中にいるとき、なぜこんなに酔っているのかということですか?
他のニュースでは、Q-Starを覚えていますか?
元GitHubのCEOであるナット・フリードマン氏と、彼の投資パートナーであるダニエル・グロス氏が、人工知能コーディングアシスタントの開発者であるMagicに1億ドルを投じたとのことです。
彼らは何を見たのですか?
まあ、彼らは、350万語のテキスト入力を処理できると主張しています。
そして、Magicは、昨年OpenAIによって開発されたQ-Starモデルに類似したアクティブな推論能力を可能にする技術的なブレークスルーを達成したとも非公式に主張しています。
Magicの共同創設者兼CEOであるエリック・スタインバーガーは、以前からAIモデルが推論する問題に取り組んできました。
以前はMeta-platformsで働いており、強化学習がAIモデルが最適な解決策を見つけるのにどのように役立つかについて研究を行っていました。
ここにはあまり詳細がありません。
掘り下げるほどの情報はあまりないかもしれません。
おそらく、それは宣伝効果かもしれませんね。
しかし、投資家たちは1億ドルを提供するだけでなく、NVIDIAチップのプライベートクラスターも提供しているようです。
彼らは何かを見ているようです。
Magicに目を光らせて、彼らが何を考えているのか見てみましょう。
次にAIのニュースでは、少し筋書きが変わります。
スタンフォード医学研究所の研究により、女性と男性の脳の組織パターンが異なることが特定されました。
スタンフォード医学研究者たちは、男性と女性の脳を区別できる強力な新しい人工知能モデルを開発しました。
人の性別が脳の組織や機能にどの程度影響を与えるかは、科学者たちの間で長い間議論の的となってきました。
生まれつき持っている性染色体が、特に早期の発達、思春期、加齢期において脳にさらされるホルモンのカクテルを決定するのにどのように影響を与えるかは、長い間研究者たちが脳の具体的な違いと性別を結びつけるのに苦労してきました。
男性と女性の脳の構造はほぼ同じように見え、脳の領域がどのように協力して働くかを調べた以前の研究も、主に性別の一貫した脳の指標を見つけることに失敗してきました。
彼らの現在の研究では、ヴィノド・メノンと彼のチームは、最近の人工知能の進歩と複数の大規模データセットを活用して、これまでに使用されてきたより強力な分析を追求しました。
まず、彼らは脳画像データを分類する深層ニューラルネットワークモデルを作成しました。
研究者たちは脳のスキャン画像をモデルに見せ、男性の脳または女性の脳を見ていると伝えると、モデルはどの微妙なパターンが違いを見分けるのに役立つかに気づき始めました。
このモデルは、動的MRIスキャンを分析する深層ニューラルネットワークを使用したため、以前の研究よりも優れたパフォーマンスを示しました。
研究者が約1500の脳スキャンでモデルをテストしたところ、スキャンが女性か男性かをほぼ常に判別できました。
このモデルが米国やヨーロッパの複数の施設からの脳スキャンを含むさまざまなデータセットで非常にうまく機能することは、この種の研究における多くの混乱要因をコントロールしているため、特に説得力があります。
性別が人間の脳の構成に強力な影響を与えることの証拠であると、メノンは述べました。
その後、チームは、女性と男性の間で異なる機能的脳特性に基づいて、参加者が特定の認知課題でどれだけうまくできるかを予測できる別のモデルを作成できるか疑問に思いました。
この男性は恐れを知らないのですか?
彼らは認知能力の性別固有のモデルを開発しました。
1つのモデルは男性の認知パフォーマンスを効果的に予測しましたが、女性ではそうではありませんでした。もう1つは女性の認知パフォーマンスを予測しましたが、男性ではそうではありませんでした。
研究結果は、性別間で異なる機能的脳特性が重要な行動上の影響を持つことを示しています。
私は、これがどのように受け入れられるか非常に興味があります。というのも、少なくともここアメリカでは、これらのことについて議論が少し熱いからです。
このような研究は、それにどのように関わってくるのでしょうか?
他のニュースでは、Googleが最新鋭のオープンモデルであるGemmaをリリースしました。
Gemmaは、Geminiモデルを作成するのに使用されている同じ技術から構築された軽量で最新鋭のオープンモデルのファミリーです。
そのため、彼らはモデルの重みを公開し、開発者をサポートするためのいくつかのツールも提供しています。
ここでは、LLaMA 2との比較を示しており、少なくとも比較されているタスクのほとんどで見た目はより良いようです。
ここでは、特定の出力を検閲することを意味するときにAIセーフティと言うのをやめてくれて嬉しいです。
それはAIの安全性ではないはずですよね?
ここでは責任あるという言葉が使われているようですね、それは良いことです。
私の懸念は、彼らが検閲のネジを締めすぎたのかどうかです。
それは非常に使いにくくなるかもしれません。
そうでなければ、それは非常に良いツールになるかもしれません。
どちらにせよ、より多くのオープンソースモデルは業界全体にとって素晴らしいです。
より多くの人々が開発し、情報を共有し、オープンソースコミュニティが成長すると、オープンソースコミュニティの力が増します。
それで今日はこれで終わりです。
楽しんでいただけたと嬉しいです。
私の名前はウェス・ロスです、ご視聴ありがとうございました。