この動画では、人工一般知能(AGI)の急速な進歩について語っています。特にOpenAIの進捗と、これらの発展に対する広範なAIコミュニティの反応を強調しています。当初は懐疑的に見られていたOpenAIの作業、特にChatGPTとテキストから動画へのAI生成プラットフォームであるSoraは、AGIに向けた重要な一歩を踏み出していることを示しています。この物語は、AI能力の指数関数的な成長に触れており、「チェス盤の後半」に例えて、AGIが予測不可能かつ急速に現れる可能性がある点に近づいていることを示唆しています。また、OpenAIがAGIに向けて開発しているさまざまなコンポーネント、AIエージェントやウェブ検索プロダクトなどにも言及し、AGIが日常生活の様々な側面にシームレスに統合される未来を指摘しています。
公開日:2024年2月20日
※動画を再生してから読むのがオススメです。
今、新たに現れつつあるものがあり、それについて話す必要があります。
そして、それはかなりショッキングです。
それはAGIです。
覚えておくべき唯一のルールが1つあります:パニックしないでください。
このウサギの穴に入って、どこまで行けるか見てみましょう。
おそらく、今までにOpenAIの最新リリースであるテキストからビデオを生成するAIプラットフォームであるSoraを見たことがあるでしょう。
それはとてもクールです。
多くの人々が、それが生成できるリアルな画像に非常に感銘を受けています。
しかし、多くの人々がこのものが何であり、何を表しているのかを見落としています。
最近、AGI、人工汎用知能について多くの議論がされています。
サム・アルトマンがAGIについて話し始めたとき、彼は嘲笑されました。
人々はAGIの構築について話すことは真剣ではないと言いました。
ChatGPTをリリースした後、人々はもはや彼を嘲笑しませんでした。
私たちは長い間誤解され、ひどく嘲笑された組織でした。
私たちが始めたとき、2015年末に組織を発表したとき、大手産業用AI研究所の著名なAI科学者が個々の記者にDMを送っていて、これらの人たちはあまり優れていないし、AGIについて話すのはばかげていると言っていました。そして、彼らに時間を割くのは信じられないと。
その分野では、新しいグループの人々が「AGIを構築しようとする」と言ったレベルの小さなこじつけや憎しみがあった。
DeepMindのAIは、嘲笑に直面してもAGIについて話す勇気のある少数の人々の集まりでした。
今はもうあまり嘲笑されません。
今はもうあまり嘲笑されません。
もっと多くの人々が、将来の数十年でAGIを見るかもしれないと信じています。
しかし、ここがポイントです。この分野を研究している人々も含めて、指数関数的な成長や複利によって振り回され続けています。
私たちはチェス盤の後半に差し掛かっています。
そして、事態は少し狂ったものになろうとしています。
さあ、深く掘り下げてみましょう。
「チェス盤の後半」という表現があります。
チェス盤の後半に関する話は、チェスの発明者がその素晴らしい創造物を感謝しているインドの王に提示したというものです。
王は望まれる報酬を尋ねました。
チェスの発明者は非常にシンプルなものを求めました。最初のマスに米粒を1つ置き、次のマスにはその2倍を置き、そして全てのマスが覆われるまで続けるようにと。
つまり、1、2、4、8、16、といった具合に、毎回倍々になっていきます。
これは多くはないように思えるかもしれませんが、それはただ数粒の米です。
しかし、この指数関数的な成長、この複利が本当に複雑になるのは、チェス盤の後半です。
今日の現代において生産される米の量の1000倍の量です。
しかし、ポイントは、王が支払うことができたものをはるかに上回っていました。
このすべてのポイントは、AIの進歩がチェス盤の後半に入り、それがどのように見え、どのように展開されるかを予測するのが本当に難しくなるということです。
多くの人が尋ねていますが、AGIはいつここに来るのでしょうか?
私はその質問が好きではありません、その理由はこちらです。
これは2015年のブログWait But Whyからのもので、それなりに前のもので、AIが到来したときの様子を素晴らしく示していました。
その看板がAGIと書いてあると思ってください。
そして、これがAGIの駅ですね?
そして、ここでは皆が立ち止まって、いつAGIの列車が到着するのかを不思議に思っています。
それは7か月後か、12か月後か、5年後か?
なぜなら、それが近づいている兆候を感じているからです。
ねえ、見て、AGIが到着しているでしょう?
私たちは遠くの方でそれを見ています。
それが駅に到着して、私たちがそれを迎えてどのように見えるかを見ることができるのはいつですか?
それは、急速にやってきています。
そして今はもう過ぎ去ってしまいました。
それを見逃しましたか?
これは、それがどのように起こるかを示すチャートです。
これが地球上で最高の知性ですよね?
仮定すると、これは時間の始まりからのようなもので、徐々に生命体が賢くなっていく、賢くなっていく、賢くなっていく。
そしてここがトリップワイヤーです。
ここで、自己改善型のAIのようなものを作り出し、ズームという感じです。
ティム・アーバンはこのブログWait But Whyを運営している人物で、今は書籍も出していると思います。
明らかにイーロン・マスクはこのブログの大ファンで、過去につぶやいていました。
このブログ投稿は2015年のものだと思いますが、その頃OpenAIがちょうど開設されたばかりで、AGI(汎用人工知能)の開発に取り組んでいることでからかわれていましたので、その点を念頭に置いてください。
当時、AGIの中央値の専門家予測は2040年でした。
そしてASI、人工超知能は2060年でした。
こちらはARK Investのキャシー・ウッドと、この分野で働いているいくつかのアナリストです。
これが彼らが予測したことです。
専門家たちが一般的な人工知能を達成すると信じている時期のチャートをこちらに示します。2019年には50年後だと思われていましたが、1年後には34年後、さらに1年後には18年後、その後8年後だと思われるようになりました。
この予測に基づくと、2030年までに、今から約6年後にはAGIを持つことになると予測されています。
しかし、進歩が非常に速かったため、予測誤差が生じました。
そして、このまま進めば、2026年までにAGIを持つことになるでしょう、今から2年後です。
ここで取り上げた他の論文も、だいたい同じことを言っています。
専門家たちは皆、AIの急速な加速に驚かされ続けています。
7年前、サム・アルトマンはAGIを構築していると言ったことで嘲笑されました。
今では、もうすぐここに来ると言うのは狂ったことではありません。
具体的にはいつか?
それは重要ではありません。
これは私たちです。
そして次の瞬間、AGIを測定するために選んだ基準を超えていくでしょう。
動画の最後までに、それがすでに達成されている可能性がある理由を示します。
ただし、それはまだ普及していません。
前回の動画では、シニアリサーチサイエンティストであるジム・ファン博士が言ったことについて説明しました。
このビデオ生成モデルは、物理学を学んでいるというポイントでした。
物理学をシミュレートする能力は、新たに現れる性質です。
より多くのデータを投入し、リソースを拡大すると、これらの能力が現れます。
それらは存在し始めます。
より多くのデータと計算能力が、これらのデジタル脳が暗黙的に新しいスキルを獲得できるようになる。
私たちが教えないことをするように学びます。
私がこれについて話すビデオを投稿するたびに、コメントセクションには、これが絶対に真実ではないと叫ぶ声の多数派がいます。
私たちはただ想像しているだけで、これらのことは何も起こっていない、などと言われます。
しかし、ますます多くの人々が持つ見解に急速になっています。
OpenAIは、これについてより公然と話しています。
彼らはSoraを少しのビデオ生成機や画像生成機として話していません。
彼らはそれを世界シミュレーターとして話しています。
これは物理世界の一般的なシミュレーターを構築するための有望な道筋だと言っています。
Soraは、現実世界を理解しシミュレートできるモデルの基盤として機能します。
私たちがAGIを達成するための重要なマイルストーンと考える能力です。
今度はOpenAIに話を変えてみましょう。
OpenAIはどのようにAGIを構築しているのですか?
ChatGPTがAGIになるものですか?
SoraがAGIになるものですか?
まあ、ちょっと違います。
AGIや最終的にはASI、つまりAGIの超知能形態を、それぞれが独自の力と能力を持つ部分の集まりと考えてください。
しかし、それらを組み合わせると、AGI、つまり大きなものになります。
では、それらの部分は何でしょうか?
Sora、つまり世界シミュレーターを今では知っています。
ChatGPT、史上最も急成長しているアプリで、今では見たり、聞いたり、話したりできます。
それ自体が強力な形態のAIです。
他の部分は何でしょうか?
そのうちの1つはエージェントです。
サム・アルトマンは11月の開発者会議でこれについてほのめかしました。
実際、彼がそれをほのめかしていたかどうかはわかりませんが、かなり曖昧でしたが、私自身や他の多くの人々は、彼が自律型AIエージェントについて話していたと思ったと思います。
OpenAIが自律型AIエージェントの開発に急速に進んでいるようですので、私たちがそのように仮定していたことが確認されたと言えるかもしれません。
サム・アルトマンは、ChatGPTの次のイテレーションを、仕事用のスーパースマートな個人アシスタントとして非公開で呼んでいます。
そのエージェントは、人々のコンピューターを引き継ぎ、基本的に彼らのために多くのタスクを行います。
それは、あなたのために何かを行うオペレーティングシステムのようになります。
何かをクリックしたり何かを入力する代わりに、声やタイピングなど、どんな形であれそれとコミュニケーションを取り、それからあなたが要求したことを行います。
そして、それを自律的に行うことができます。
私たちはこのチャンネルでいくつかのこれらのAIエージェントをテストしてきました。
高いレベルのタスクを与えます。
それについて考え、サブタスクに分割します。
そして、それらを実行し始めます。
そして、OpenAIだけではありません。
GoogleのCEOサンダー・ピチャイは、最新の技術により、時間の経過とともによりエージェントのように行動できるようになると述べています。
同じことをしている他の企業もあります。
rabbit r1デバイスも似たようなことをしています。
ここで取り上げたMultionもあります。
Open Interpreterがあります。
自己運用コンピューターがあります、それを呼ぶと思います。
これを試みている多くのものがいます。
では、ChatGPTがあります、Soraがあります、エージェントがいます。
他に何がありますか?
さて、OpenAIはGoogleに挑戦してウェブ検索製品を開発しています。
その検索製品がChatGPTとは別なのか、ChatGPTの一部なのかはわかりません。
では、検索は禁じられた者の左足、またはAGIです。
他に何がありますか?
さて、AIモデルを訓練し推論を実行するために必要なAIチップ、コンピュート、GPUやTPU、またはその他のプロセッサーの膨大な量があります。
推論とは、求めている出力、予測を得ることを意味します。
アルトマンはすでに中東のファンドや中国から流入した多額の資金から多くの関心を集めています。
米国政府の機関の1つが、サンフランシスコにあるRainne NeuroMorphicが製造したチップの取引の1つをキャンセルし、取り消したと思います。
しかし、サム・アルトマンは諦めません。
今、彼はバイデン政権に承認を求めています。
サム・アルトマンは、これらのチップを生産するためのインフラを構築するために7兆ドルの資金調達を探していると言われています。
7兆ドルの資金調達です。
実際、それは8兆ドルになりました。
しかし、ポイントは、私たちがAGIに望むすべてを実現するために、必要な量のチップを生産するために多額の資金が必要です。
すべての要素が揃ったら、GPTやSora、DALL·E、Search、Autonomous Agents、そしてすべてのチップが揃ったら、まだリリースされていない音楽/サウンド生成のものもあるようですが、それは近日中に登場する予定です。
実際、私はこのSora Plus Audioモデルに早期アクセスを得ました。ここにいくつかの早期結果があります。
これは、山の頂上でポッドキャストを行っている2匹のゴールデンレトリバーです。
それがどのように聞こえるかを聞いてください。
正直に言って、悪くないと思います。
彼らがiTunesのポッドキャストランキングを急速に上昇させると予想しています。
しかし、私が言いたいのは、私たちがAGIと考えているものは、おそらく複数の部分からなるものであり、それぞれが独自の効果を持ち、独自の強みを持ち、組み合わされると、今やほとんどの人間の仕事を行うことができるようになります。
たとえば、コーディングアシスタントは、すでにコーダーがより速く作業するのを助け、彼らが行わなければならない作業の一部を置き換えています。
Googleは、従業員がより速くコードを書くのを助けるために内部AIモデルであるGooseを静かに立ち上げました。
GPTのようなモデルはコーディングを助けます。
Code Interpreter(高度なデータ分析とも呼ばれる)で遊んだことがあれば、それはデータ分析に本当に役立つでしょう。
たくさんのことは、以前はアナリストが担当していたことが、今では数文章でできるようになっています。
彼らはExcelシートを見ることができ、希望通りに整理し、さまざまなチャートを表示することができます。
コーディングの仕事、データ分析の仕事、執筆の仕事の多くは、そのような仕事をしている人々の多くを置き換える部分です。
次は、Soraです。
Soraはビデオや画像などを制作しています。
それを誰が置き換えるのか考えてみてください。
どのようなスキルや人々、作業環境がそれを置き換えるのでしょうか。
こういうものを見てみましょう。
では、東京で何かを撮影したいとしましょう。
どうしますか?
まあ、そこに飛んで行くか、現地で撮影するために誰かを雇う必要がありました。
俳優、編集者、写真家/カメラオペレーターが必要ですが、それだけでなく、機器を製造する人々、カメラを製造する人々、照明機器、マイク、ストレージディスクを製造する人々も必要です。
こうしたことには、映画のための特殊効果クリエイターを雇う必要がありました。彼らは、このような視覚的に見事な効果を生み出すのを手伝ってくれます。
もし、これと同じようなことをしたいと思ったら、それはマクロ撮影ではありません。
これは実際にはマクロ撮影ではありません。
目の中にズームされたようなもっと良い例があります。
その特別なガラスのために作られなければならない特別なレンズが必要です。
そのようなディテールを撮影できる人が必要です、つまりマクロ撮影です。
もし私たちがそのような画像を生成できるようになれば、それらの仕事はすべて影響を受けます。
次にエージェントがありますが、エージェントは、あなたが必要とするすべてのもの、つまりあなたのアシスタントのようなものになります。
メールの返信やアポイントメントのスケジュール設定、オンラインでのリサーチ、Excelでのタスクの完了など、デジタルの世界で実際に行う必要があることすべてに対応します。
そして、おそらくいつかは電話でも対応することになるかもしれません。
OpenAIにはWhisperモデルがあります。
これもこの一部です。
それに話しかけると、あなたが言っていることを単語に変換できます。
その後、GPT-4はあなたが言っていることを理解できます。
もしレストランに電話して、例えば予約をしてほしい場合、エージェントに加えてGPT、ChatGPT、そしてWhisperのようなものが必要です。
そして今は、音声を作成するためにElevenLabsを使用する必要があります、つまり人間が話しているように聞こえるようにするためです。
ChatGPTがテキストを出力すると、それがAIの声に変換されます。
しかし、前にも述べたように、OpenAIはその裏で料理をしているようで、音声モデル、オーディオモデル、私が提供したプレビューは、ただマイクに息を吹きかけているだけです。
うまく伝わっていることを願っています。
そしてもちろん、必要なチップやGPUは最後のピースのようなものです。
それがAGIの一部と考えるべきかどうかはわかりませんが、それは単にスケールを拡大させるだけなのでしょうか?
しかし、ポイントはここにあります。コンピュートを増やすと、ただの無意味なものからどのようにスケールするかです。
わかりますか、それを増やすと出口が良くなります。
さらに処理能力を高めると、非常にリアルに見えるようになります。もっとチップを追加し、もっとコンピュートを増やすだけです。
それ自体が信じられないほど効果的にスケールアップします。
コンピュータチップはそれの一部と考えることもできますし、これがスケールするのを助けるものと考えることもできます。それはどのように考えるかによります。
しかし、ポイントは、ボード上にこれらの小さなピースがすべて揃ったときに現れるもの、ゆっくりとポータルを浮遊し始めるもの、それがAGIなのです。
それが私たちが考え、学び、作成し、画像や声を生成し、与えられたすべての画像やビデオを理解し、言ったことの意味を理解することができるものです。
それがいつやってくるのでしょうか?
それはいつ手に入るのでしょうか?
では、これがジミー・アップルズです。
このチャンネルで何度か言及してきました。
そして以前にも述べたように、ここでのすべてを一つの塩分として受け取ってください。
ジミー・アップルズは、OpenAIの内部者であり、OpenAIで起こっていることについてかなり詳しい人物であり、時々暗号的なツイートでこの情報をリークしています。
私は何も推奨していません。
これが真実だと言っているわけではありません。
実際、この人物が何かについて完全に間違っている場合、彼が予測することを完全に無視できるようになれば、私の仕事は少し楽になると感じています。
しかし、問題はここにあります。
彼は驚くほど正確であり、彼が言っていることを完全に無視するのが非常に難しい状況です。
このチャンネルでは、すべてを見ていきます。
科学論文やデータを見る予定であり、陰謀論者や陰謀論者も見る予定です。
これは完全なスペクトラムのAIチャンネルになります。
それでは始めましょう。
こちらがyumidiotですが、Soraの後、点を結びつけることが非常に難しくなり、OpenAIが既にAGIを持っているという驚くべき結論に至ると言っています。
一つの点は明らかにAppleとそのリーク情報の存在です。
Appleはジミー・アップルズと彼のリークのことです。
一般の人々はAppleを伝説的なリーカーだと思っていますが、私の意見では、彼は神聖な計画を明らかにする伝説的な預言者であり、それはsama、サム・アルトマンである神皇帝の神聖な計画です。
Appleは非常に高得点を獲得しています。
3月14日にGPT-4のスコアが下がった。
彼はそれを予測した。
GobiとArrakisの名前がスコアを上げた。
彼はそれを予測した。
その情報によって確認されたと私は信じています。
Arrakisが何であれ、Arrakisは映画「Dune」の惑星の代替名です。
今やNetflixで映画になっているSF小説「Dune」。
実は、私は意外なことに「Dune」を読んだことがありません。
それは古典的なSFの本の1つです。
私は最近それを手に入れ、それを見ています。
そして彼らは続けます。
Samaの解雇がスコアを下げた。
これは私にとって、この人が言っていることが現実に一部当てはまる可能性があることを確信させるものでした。
これは2023年10月24日、ジミー・アップルズの投稿でした。
OpenAIで雰囲気が変わり、いくつかの重要なOpenAI従業員を失うリスクがあります。
それを念頭に置いておいてください、10月24日。
それが10月25日の投稿です。
しかし、サム・アルトマンは11月17日に解雇されました、ほぼ1か月後です。
そして、サム・アルトマンは解雇について知らなかった。
通常の従業員は解雇について知りませんでした。
ミラ・ムラティさえも、解雇については、解雇の前日まで知らなかったと思います。
取締役会とイリヤ・スツコーヴァーは、前日にミラに接触しました。
前日だったか、わずか数時間前だったかは覚えていません。
その時点で、彼女は臨時CEOとして立ち上がらなければならなかったため、それについて少し前もって知っていた取締役会メンバーの小さなグループの外で唯一知っていた人でした。
そのため、ジミー・アップルズは10月25日にサムの解雇につながる雰囲気の変化について知っていました。
ジミー・アップルズは、2月15日に大きなリリースがあったことをリークしたようです。
彼は、代替アカウントからそれをリリースしたと言っています。
何が起こっているかわからないので、ここでのすべてを塩梅に取ると言っているのですが。
しかし、本題に入ります。
ジミー・アップルズは、OpenAIが内部でAGIを達成したと言っています。
2025年にリリースされる予定です。
彼はリラックスできる素敵な農場を探していると言っています。
そして彼が大手研究所から見たいと思っているのは、将来の仕事の喪失をどのように解決するかに取り組んでいることです。
ジミーはこれを再投稿しました。
過去8ヶ月間、自律エージェントを構築してきました。
AGIは誰もが予想しているよりもずっと近いと断言できます。
必要なのは、ローカルで実行できる安価なGPT-5だけです。
OpenAIが既にこれを内部で構築している可能性があると私を驚かせないでしょう。
経済的に実現可能ではないだけです。
彼はまた、一部の論文を再投稿しており、その中には当チャンネルで取り上げたエージェント、自律エージェントに関するものもあります。
たとえば、Tencentは自律AIエージェントに関する複数の論文を公表しています。
そのうちの1つは、スマートフォンユーザー向けの多様なモードのエージェントです。
中国からは、自律エージェントに関する多くの研究が出ています。
彼がほのめかしている多くのことがあります。
これは、OpenAIがAIの進歩を自律エージェントに向けて進めることを確認する前のことでした。
さて、別のビデオで取り上げたように、私たちがこれらの自律エージェントであると信じているOpenAIの従業員であるベン・ハウスは、最新かつ最高のモデルを活用した業界を定義する可能性がある製品を構築していると述べています。
そして、OpenAIのプロダクト担当副社長であるピーター・ウェランダーは、ベンが取り組んでいるこの製品がすべてを変えると述べました。
私は匿名のリークを無視したいと思っても、この情報を振り返るたびに、彼の情報は確認されるのが1か月から2か月遅れているようです。
こちらは2023年12月8日、オープンソースのMoEが近日公開される予定です。MoEは専門家の混合物を意味します。
これが、私たちがOpenAIがGPT-4を実行するのに効果的に使用したと考えているものです。
それがそれほど優れていた理由の1つです。
おそらくここでは、MistralまたはMixtralについて話しているのでしょう。これは、現在GPT-4に似た多くのタスクで非常にうまくいっているフランスのオープンソースモデルです。
正確なランキングは覚えていませんが、確かに専門家の混合物を使用していることがわかっている非常に強力なオープンソースモデルの1つです。
また、ソラのリリースによって完全に影が薄くなってしまった大きな出来事は、Gemini 1.5のリリースでした。
おそらく、このアナウンスメントの数時間後にOpenAIがSoraをリリースしたため、これを完全に無視したかもしれません。
これは完全に影が薄くなってしまいましたが、見た目以上に大きな意味があります。
Gemini 1.5は、Gemini 1.0よりもはるかに優れています。
中型モデルは、以前のGoogle Geminiの大型モデルであるUltraと同じくらい優れています。
それはより速く、トレーニングするのにもっと安いです。
それはより優れています。
なぜですか?
新しい専門家の混合物であるMoEアーキテクチャという理由の1つです。
今、彼は単に彼の予測が幸運に見えるようで、実際に何が起こっているのかわからないかもしれないと言っているかもしれません。
では、2023年11月29日はどうですか?
3か月前はどうでしたか?
彼は、OpenAIが今年の3月にビデオ生成を決定したと言っています。
2023年にはどうでしょうか?
私たちはこれを来年、つまり今すぐ見ることができるでしょうか?
はい、見ることができました。
彼らはまだ新しいジュークボックスモデルに座っていることを思い出してください。
それは、以前にプレビューをお見せしたジュークボックス音楽のことです。
そして、DeepMind、Runway、Pika、およびオープンソースが彼らを追い込むだろうと彼は言っています。
ほとんどのOpenAI従業員がビデオ生成モデルについて知らなかったことを覚えておいてください。
彼らはリリース直前にそれについて簡単に説明を受けました。
私はAIについてたくさん読んでおり、人々が話しているすべてのことについても読んでいます。
お伝えできますが、2023年にOpenAIによるビデオ生成モデルについて誰も話していませんでした。
そして、ここは2023年11月で、彼は4peatについて話しています。
ちょっと待って、その話に戻ります。
OpenAIはほぼ1年間、Soraの上に座っていました。
GPT-4は2022年7月にトレーニングを終えました。ちなみに、Microsoftからいくつかの論文が出ていて、そこではGPT-4をテストしているスクリーンショットがいくつか見られます。
それは一般の人々に公開される前の数ヶ月前のことでした。
トレーニングが終了し、何らかのレッドチームの人々、つまり安全性をテストしていた人々やOpenAIに近い他の組織がテストしていました。
私たちがそれを手に入れる前のことでした。
そして、彼はGobi、Arrakis、Q-Star、4peat、Orionなどもあると言っており、GPT-4よりもはるかに進化しているようです。
これらのいくつかを取り上げました。
Q-Starも取り上げました。
これらのほとんどを取り上げました。
4peat、私が信じているのは、サム・アルトマンが4回も、私たちの無知の最前線が押し戻され、世界の知識が前進したときに部屋にいたということです。
それがリークされたQ-Starだったのでしょうか?
全くわかりません。
お別のプロジェクトだったのですか?
わかりません。
GPT-4がリリースされたときを覚えていますか、彼らは正式なデモデーを行いました。
それはかなり大きな話題でした。
Soraがリリースされたとき、彼らは何もせず、それが特別なことではないかのようでした。
彼らはAGIに非常に近いタイミングでそれをリリースし、何も特別なことではないと言いました。
彼らはAGIの整合性に取り組んでおり、AGIの整合性ではありません。
疑問が生じます、AGIとは何でしょうか?
それって、一体何なのでしょうか?
では、Googleの見解をご紹介します。
これがGoogleのAGIのレベルです。
こちらがAGIのレベルで、こちらが狭いAGIの位置です。
例えば、我々は超人的な狭いAIを持っています、それはこれらの狭いタスクで100%の人間を上回ることを意味します、そうですよね?
もちろん、AlphaFoldやAlphaGoのようなものを考えると、チェスをプレイするだけのこの狭いAIは超人的なレベルのAI、狭いAIです。
それはチェスでどんな人間にも勝つでしょう。
それが狭いタスクで、一般的な側面は基本的にほとんどのタスクです。
レベルゼロのAIは狭く、計算機レベル1は新興で、ここにChatGPT、GPT-4、Bard、LLaMA 2、Geminiが置かれていますね。
それは、新興のAGIのレベル1のようなものです。
もしくは未熟な人間よりもやや優れているということです。
そして、レベル2は有能です。
これは、少なくとも熟練した大人の50パーセンタイル以上です。
ここでは、有能な狭いAIの例を挙げていますが、有能なAGIはまだ達成されておらず、それが熟練した大人の90%を上回るという段階です。
それは90パーセンタイルに位置しています。
そして、ここでは狭いAIについて、画像やDALL·Eなど、生成画像モデルなどが挙げられていますね。
次に、レベル4、Virtuoso、熟練した大人の99%よりも優れており、Deep BlueとAlphaGoがあります。
我々は熟練した大人の99%を上回ります。
それは、世界チャンピオンの囲碁プレーヤーである李世ドルを打ち負かしますが、チェスをプレイするAIほど驚くほど優れているわけではないと思いますね。
そしてもちろん、超人的な、現在の世界の100%よりも完全に優れているということです。
我々は、ここにいると信じています。
我々はこの新興のAGIの段階にいます。
AGIがいつ到来するか、というとき、ほとんどの人が話しているのは、おそらく、有能なAGIや専門家のAGIのようなものだと感じます。
彼らは、大人の下半分、熟練した大人の下半分を上回るか、あるいは熟練した大人の90%を上回るかのどちらかだと思います。
それは半分の人よりも優れているか、90%の人よりも優れているか、あるいはその間のどこかに位置しているか、ということです。
ある時点で、サム・アルトマンは、将来のAIモデルが中央値の人間よりも優れていると何か言っていたと思います。基本的には有能なAGIだと。
AGIの定義を、レベル2とレベル3の間に位置するものとしましょう。
それは人々の半分よりも優れているか、90%の人々よりも優れているか、あるいはその間のどこかに位置しているか、ということです。
では、OpenAIが、熟練した大人の半分程度と同等以上の能力を持つ何かを秘密裏に持っている可能性はありますか?
文章を書いたり、税金を計算したり、スペルをチェックしたり、画像や動画や製品パッケージを作成したり、マーケティングコピーを書いたり、ExcelやWordを使ったり、ウェブを閲覧したりできる、ということです。
オフィスの従業員ができるすべてのタスクを行うことができる、つまり、彼らの半分ほどの能力を持っている、ということです。
OpenAIがこれを持っている可能性は考えられますか?
もし彼らが2022年7月にGPT-4を訓練し、それ以降いくつかの発見をしていたとしたら、ちなみに、GPT-4はまだ最高のモデルの1つです。
つまり、今やついに、競争相手が現れ、正当な競争相手がいるということです。
そして、Gemini 1.5は実際には、少なくともいくつかの分野でそれを上回るでしょう。
GPT-4はもはや独占的なチャンピオンではありませんが、陳腐化したり時代遅れになったりすることは全くありません。
もし私たちが使用しているモデルが、リーダーボードのトップに位置し、2022年7月に訓練されたものであるなら、私たちが見ているものは、非常に遠い銀河からの光のようなものであり、見ているものはずっと昔に起こったことだと理解することが重要です。
この点に戻ると、もし私たちがこのようなものを見ていて、質問が、OpenAIが彼らが地下AGIと呼ぶレベル2の有能なAGIを持っている可能性はどれくらいあるというものだったら?
言い換えれば、それは存在していますが、扉の向こうにあります。
それは世界にはアクセスできませんね。
それは誰かの地下室にあります。
それが経済的に実現可能である必要はないと仮定しましょう。つまり、例えばChatGPTのように、ランニングコストが十分に安くなっているため、彼らは無料でモデルを持つことができます。
有料モデルを持つことができます。
Perplexityには無料版と有料版があります。
要点は、彼らはコストを下げて、それを一般に公開し、全世界がそれを使用できるようにしたということです。
それを一時忘れましょう。
このチャンネルで読んだ特定の論文から、推論により多くのコンピュートを費やすこと、つまりコンピュータに答えを熟考させることは、その質問に答える能力を向上させるようです。
それはほぼより高度なAIの能力を複製しています。
例えば、もし私たちがGPT-4に質問をした場合、そして通常その質問に答えるために10セントのコンピュートコストがかかるとします。
もし私たちがその質問に答えるために1,000万ドルのコンピュートを費やすことを許可したらどうなるでしょうか?
何が起こるでしょうか?
私たちが見てきた研究のいくつかからは、例えばGPT-5がその質問に答える方法のシミュレーションになると思われるようです。
コンピュートを増やすだけで、そのモデルがより高度なレベルでどのように振る舞うかを見ることができます。
実際、イリヤ・サツキヴァーは少し話したと思います。この種のアプローチは、次世代モデルの安全性テストを行うことを可能にし、実際にそのモデルを訓練する前に、それを解き放つ前に、どのように振る舞うかをシミュレートすることができます。それには、与えられた質問に対してはるかに多くのリソースを費やすだけで十分です。
実際、それはそれを近似する方法であり、将来をほぼのぞき見る方法です。
OpenAIがどこにいて、私たちが見ているものと、おそらく彼らが密室で持っているものとの違いを知っているとして、かつ、物事のコストを考慮しないでください。
彼らが単にコンピュートに無制限にアクセスできると仮定しましょう。
彼らが有能なAGIを持っている可能性はありますか?
それが熟練した大人の50%ほど優れているものですか?
どのような確率を与えますか?
私にとっては、それは非常にありそうで、少なくとも可能性があります。
50:50よりも良いかもしれません。
では、質問に答えるとすれば、我々はいつAGIを手に入れるのでしょうか?
おっと、見逃しましたか?
なぜなら、OpenAIが2022年7月にGPT-4を持っていた場合、それ以降複利で増加してきたからです。なぜなら、その間にGPUは劇的に改善されています。
資金が改善され、技術、研究、すべてが改善されています。
そして、彼らがこの間ずっと複利をしていると仮定して、チェス盤にますます多くの米粒を落としており、私たちはすでにそのチェス盤の後半に入っており、おそらくそのものはすでにここにあるかもしれません。
AGIはここにあります。
まだ配布されていません。
まだリリースされていません。
サム・アルトマンはリリースを段階的に行うこと、一度にすべてをリリースしないことについて話しています。
他のいくつかのOpenAIの従業員も同じことを言及しています。
彼らは人々に来るもののプレビューを提供し、みんなが調整してどのように対処するかを考える時間を与えたいと考えています。
事態は混沌としてきそうです。
これが具体的に何を意味するのかは予測するのが難しいです。
いつも言っているように、私は長期的にはこのAGI全体にかなり楽観的です。
長期的には人類にとって素晴らしいことになるでしょう。
しかし、短期的には波乱が起こるかもしれません。
いくつかのことを再考し、物事の機能を変えなければならないかもしれません。
人類が達成した慣性や勢いから、最初の原理から考えることを学ばなければなりません。
我々は、待って、これらすべてがどのように機能するかを再考する必要があるかもしれません。
AGIが存在する場合、仕事、お金、経済についてどのように考えるべきでしょうか?
ビデオや画像、テキストで見るものについてどのように考えるべきでしょうか?
人間の業績や自己価値感についてどのように考えるべきでしょうか?
機械がほとんどのことをより良くできるようになったら、私たちの人生の目的は何でしょうか?
それが多くの人々を怖がらせていることはわかっています。
とても賢く、才能のある人々がたくさんいるのを見ますが、彼らは他の人々よりも優位性を持っていると信じている部分が消えてしまうのではないかと心配しているようです。
ここが多くのアーティストが非常に心配しているところです。
AIについてアーティストコミュニティが言っていることを見たことがあれば、非常に敵対的な態度を取っています。
全員がそうではないですが、少なくともそのコミュニティの一部は匿名でTwitter上で発言しています。
彼らは本当にそれが好きではないと言っています。
彼らはそれが好きではありません。
それを違法にしたいと考えています。
そして、それには何の利益もないと言っています。
私は2019年の終わりごろだったと思うのですが、Redditのフォーラムで、世界のどこかで起こっているウイルスについて話しているのを見つけました。
人々を病気にさせ、急速に広がっていました。
その当時、それは非常に人口の多い国の1つの都市だけでした。
一部の人々は、それがどれだけ急速に広がっているかについて心配していました。
その指数関数的な成長、複利が、以前に見たことよりもはるかに速かった。
もちろん、人々は心配していました。
私も少し心配していました。
その状況がどのように終わるか全く分からなかった。誰もそれについて話していなかったからです。
ニュースにも出ていませんでした。
人々にも話題にされていませんでした。
その時点では、それに名前すらついていませんでした。
人々は、それを発生した都市の名前で呼んでいました。
私は友達とそれについて話し合い、私が見ていることを彼に伝えました。
そして、私たちは両方ともそれに備えるための行動を取りました。
私はいくつかの医療用品やハンドサニタイザーなどを備蓄しました。
コストコからいくつかの大きなハンドサニタイザーを買いました。
今でもそれらを持っていると思います。
しかし、それが私たちが品切れになったものではなかったのです。
トイレットペーパーが不足していたのはみんな同じだった。
正解はトイレットペーパーだった。
そして友達は航空会社やクルーズ船の株を大量に空売りしていた。
その間、友達はさまざまな旅行、航空機、クルーズ船の株を空売りして大金を稼いだ。
そして、最低点で彼は、起こっている大量のマネー印刷に影響を受けると信じていたさまざまな株に全財産を投入した。
AGIの登場とともに、この巨大な複利効果が蓄積されており、世界に打撃を与える準備が整っており、誰も本当にそれがどのように何を影響するかを知らないという問題です。
これらの流れをどのように航行しますか?
リスクから自分自身を守るにはどうすればよいですか?
メリットを活用するにはどうすればよいですか?
お金だけでなく、一般的に、私たちが突入する新しい世界をどのように航行しますか?
今日はそれを網羅することは不可能です。
しかし、次のビデオの1つで、私たちは、おそらく2023年初頭に書かれた、AGI後の社会で実際に重要な2つまたは3つのことについて掘り下げる予定です。
もしこれを楽しんでいただけたら、高評価をクリックして、チャンネル登録をして、コメントを残してください。
できるだけ多くのコメントを読もうと努力しています。
すべてを読むのは難しいですが、できる限り読もうとしています。
最後に、おそらく山の頂上でポッドキャストをしている2匹のゴールデンレトリバーのポッドキャストの残りを聞きたいと思っているでしょう。
この動画を締めくくるために、こちらが2時間のフルポッドキャストです。
冗談です。
さようなら。