NVIDIAのCEO、AIの未来はエージェントにあると語る

2024年10月1日 03:17

6,277 文字

セールスフォースのCEOであるマーク・ベニオフとのインタビューで、NVIDIAのCEOであるジェンスン・フアンが、ドリームフォース・カンファレンスにて未来はエージェント的やと語っとるんや。
毎日何千、何百万ものエージェントが我々のために働くようになるって話をしとるんやけど、その動画を今から詳しく見ていこか。
ほな、ジェンスン、出てきてや。うちらの業界は、ざっと1兆ドルくらいの規模やねんけど、今まではツールの業界やったんや。コンピューターやソフトウェアとかな。
でもな、初めてスキルの業界になろうとしとるんや。
お前さんがエージェントって呼んどるやつやけど、ツールの上に乗っかって、ツールを使うエージェントが出てくるんや。
エージェントの可能性は途方もなく大きいんや。
もちろん、わいもそう思うで。このチャンネルを見とる人なら分かると思うけど、わいはいつも「エージェントに強気や」って言うとるやろ。
AIの未来の最高の形はエージェントとエージェント的なフレームワークやと本気で信じとるんや。
マーク・ベニオフがそう願うって言うとるのは、エージェントフォースのことやな。
セールスフォースの新製品で、会社の歴史を変えるもんやと期待しとるんや。
インターネットの歴史でいうたら、セールスフォースはめっちゃ長いこと続いとる会社やけど、今回の賭けは大きいんや。
ちなみに、あとでマイクロソフトをちょっとディスっとるんやけど、それもあとで聞いてもらおか。
頭おかしいみたいに聞こえるかもしれんけど、すごいことがあるんや。
我々が頼んだことの微妙なニュアンスも理解できて、ツールも使えて、推論もできて、お互いに理解し合って協力もできるエージェントができるんや。
エージェントフォースに問題を投げたら、エージェントがその任務を達成するのに役立つ他のエージェントを見つけに行って、一緒に集まって協力して、その問題を解決するんや。
そういうエージェント的な未来をわいは想像しとるんや。
エージェントがおって、エージェントが他のエージェントを生み出して、お互いに協力し合うんや。
ツールもあって、3つや4つ、5つやなくて、何千、何十万ものツールをエージェントが選んで使うんや。
自分でツールを作ったり、テストしたり、保存したり、後で使ったりもできるんや。
これらはまだほんの始まりに過ぎんのや。
コアモデルが良くなって、大規模言語モデルが良くなって、その周りのエージェント的なフレームワークが良くなって、エージェントが自分でツールを作ったり、既存のツールを選んだりする能力が向上すると、全てのエージェントが指数関数的に強力になるんや。
エージェントの定義を忘れんといてな。
大規模言語モデルに、ツールを使う能力と他のエージェントと協力する能力、そして短期と長期の記憶を持たせたもんや。
これがわいの好きなエージェントの定義や。
ほな、続きを見ていこか。
わいにとってのブレイクスルーは、教師なし学習が可能になった瞬間やったんや。
人間がデータにラベルを付ける能力がAIの能力拡大の制限要因になってたからな。
教師なし学習が出てきて、言語モデルを使って言語モデルを作れるようになって、人間の知識を符号化して、それを使って多様なデータを学習できるようになったんや。
そこから先は、規模が指数関数的に拡大していくんや。
ほな、今の話を噛み砕いて説明したるわ。
まず、人間がAIの制限要因になっとるって話やな。
確かに我々人間が生み出すデータの量は膨大やけど、AIが取り込むデータの量はもっと多いんや。
ほとんどの公開データは、もう最先端のモデルや、オープンソースのモデルに使われてしもとるんや。
今や、企業秘密のデータとか、有料のデータ、レディットやツイッター、フェイスブックみたいな、各社が独自のモデルを作るのに使うデータが残っとるくらいや。
それから、人間がデータにラベルを付ける能力も制限要因になっとるって話や。
全てのデータに人間がラベルを付けんとあかんかったら、それだけでAIの学習の速度が大幅に遅くなってまうんや。
そこで、アルファ碁みたいなプロジェクトが出てきたんや。
アルファ碁のAIは、人間が「ええ手や」「あかん手や」ってラベルを付けた囲碁の棋譜で学習したんやない。
AIのバージョンをたくさん作って、お互いに対戦させて、どれが一番強いか見て、それを何百万回、何十億回と繰り返したんや。
そうして、ほとんど人間の入力なしに、世界最強の囲碁プレイヤーを超えてしもたんや。
じゃあ、どうやってデータを増やすんかって話やけど、主に2つの方法があるんや。
1つは、今あるデータでもっとたくさんのことができるようにすることや。
例えば、推論時に思考の連鎖を使うことで、AIのスケーラビリティに新しい次元を加えるんや。
これめっちゃ面白いことやで。
今まではパラメーターの数を増やすことでスケールアップしてきたけど、これからは2つの次元でスケールアップできるんや。
1つはパラメーターの数と学習時の計算量、もう1つは推論時に思考の連鎖を使う時の計算量や。
もう1つの方法は、合成データを使うことや。
AIを使って他のAIのための良質なデータを作るんや。
OpenAIがqarプロジェクトでそれをやっとるって噂があって、それが最終的に01になったんやないかな。
もしかしたら01が他のモデルのためのデータを作っとるかもしれん。
これらのことは全部めっちゃ面白いんやけど、AIから人間という制限要因を取り除けば取り除くほど、AIはどんどん爆発的に賢くなっていくんや。
ここにおる皆さんにとって、これは本当に素晴らしい時代やで。
コンピューター技術がムーアの法則を超えるスピードで進化しとるんや。
ムーアの法則やと、10年で100倍くらいのペースやけど、今は多分10万倍くらいのペースで進んどるんや。
そうそう、ムーアの法則っちゅうのは、18ヶ月ごとにCPUに載せられるトランジスタの数が倍になるっちゅう法則やねん。
つまり、計算能力が18ヶ月ごとに倍になるってことや。
でもな、しばらく前に物理的な限界に達してもうたんや。
これ以上トランジスタを小さくしても、うまく動かんくなってまうんや。
そやけど、AIとGPUが出てきて、状況が変わったんや。
CPUは直列計算やけど、GPUは並列計算ができるんや。
AIの仕組みと並列計算のおかげで、ムーアの法則を超えてしもたんや。
今や6ヶ月ごとにチップの計算能力が倍になっとるんやで。
ムーアの法則を超えて、多分ムーアの法則の2乗くらいのペースで進んどるんや。
その理由は、コンピューターがCPUからGPUに変わって、人間が設計したソフトウェアから機械学習のソフトウェアに変わったからや。
そして今、新しいAIを作るためのフィードバックループができて、そのAIが新しいコンピューターシステムを作るのを助けとるんや。
彼は面白いこと言うとるんやけど、ちょっと聞き逃しそうなくらい早口やったな。
AIがどんどん多くのソフトウェアを作っとるって言うとるんや。
このチャンネルでもよく話しとるけど、システムをスケールアップする時に人間という制限要因を取り除けば、システムはもっと早くスケールアップできるんや。
2年前まで、人間がほとんど全てのソフトウェアを書いとったんや。
人間にとってソフトウェアを書くのは難しくて時間がかかるから、書けるソフトウェアの量に限りがあったんや。
でも、大規模言語モデルがコードを書くのが上手くなってきて、どんどん多くのコードを書くようになってきたんや。
それに、カーソルやレペットみたいなプロジェクトが、大規模言語モデルの周りにインフラを作って、AIがもっと簡単にコードを書けるようにしとるんや。
わいは、短期的にも中期的にも、コードを書く人の数が爆発的に増えると思うんや。
なんでかっちゅうと、実際にコードを書く必要がなくなるからや。
自然言語で話すか文字を打つだけで、AIがコードを書いてくれるようになるんや。
そのうち、AIが必要に応じてコードを書くようになって、最終的には、AIが自分でモデルの重みを書くようになるんやないかな。
そうなったら、多分我々はもうコードを読めんようになるかもしれんな。
これについて考えとったんやけど、将来的には多分AIが書くコードを我々は読めんようになるんやないかな。
今のコードが自然言語に近い形になっとるのは、人間がコードを読み書きするのが下手やからなんや。
でも、将来はそうである必要がなくなるかもしれんし、多分そうはならんと思うんや。
特に、将来のコンピューティングプラットフォームが単にモデルの重みになるんやったら、なおさらや。
我々は今でもモデルの重みを読めへんしな。
少なくとも今のところは、AIのブラックボックスの中身は分からんのや。
将来的には分かるようになるかもしれんけど、今のところはあんまり期待できそうにないな。
我々の前には、すぐに取り組むべき価値のある課題がたくさんあるんや。
もちろん、一番インスピレーションを与えてくれるのは、ファインチューニングや、教師あり学習、ガードレールの設定、安全性に関する全ての取り組みやな。
AIを使ってデータをキュレーションしたり、安全なカリキュラムを作ってAIを教育したり、特定のスキルについてAIをファインチューニングしたり、価値観に基づいて地に足をつけさせたり。
それから、素晴らしいAI技術を使ってガードレールを設定したり、思考の連鎖を使って生成した回答の質について振り返ったりするんや。
もう、AIが一発で情報を出すだけやないんや。
今は、「自分が生成した回答は十分に安全で適切か」「これが自分の出せる最高の回答か」って考えるんや。
この考え方にめっちゃワクワクしとるんや。
2つの次元でAIの知能をスケールアップできるようになったってことやからな。
この動画でも既に話したけど、もう一回強調しておきたいんや。
学習時のスケールアップと、そのモデルに与えるデータ量のスケールアップ。
そして、推論時のスケールアップ。
これが、わいの考えではもっとスケーラブルなんや。
時間と計算リソースをたくさん与えれば与えるほど、より多くのトークンを処理して、最高の出力を生成できるんや。
彼が振り返りと思考の連鎖について話しとるのは、まさにそのことや。
OpenAIから1週間くらい前に出た01が、まさにそれをやっとるんや。
だから、論理的思考や推論の面で他のモデルを大きく引き離したんやと思うんや。
自分自身で推論して、回答する前に答えについて振り返っとるんやそうやな、安全性の面でめっちゃ進歩しとるって思うわ。大事なんは、みんながこれを理解できることやと思うんや。わいはこれを「土に手を触れる」って呼んどるんやけど、基本的な考え方を理解して、これを可能にすることが重要やと思うんや。
ここにおる何千人もの人たちが、ここでコードに触れて、本当に理解してほしいんや。そうすれば、オフィスに戻った時に、お前さんが言うてるように、AIの神秘性が取り除かれて、自分でAIを作らなあかんって心配せんでもええようになるんや。
お前さんの会社の戦略的な動きのおかげで、こんなにたくさんのことが可能になったんや。じゃあ、これをみんなの手に届くようにして、すぐに仕事に取り掛かれるようにするにはどうしたらええんやろな。
エージェントを作るのが、なんか理科の自由研究みたいなもんやなくて、簡単にできるようにせなあかんのや。
彼が「理科の自由研究」って言うとるのは、特定の会社が出した製品のことを指しとるんや。その製品は、実際の仕事環境で使うのがめっちゃ難しくて、本当の価値を生み出すのが難しいんや。特にマイクロソフトのコパイロットを指してるんやけど、彼はそれを「クリッピーの新バージョンや」って言うとるんや。
クリッピーっちゅうのは昔、完全に失敗した製品やったんやけど、今のコパイロットをクリッピーと同じやって言うとるんや。これはマイクロソフトに対するめっちゃ大きなディスやけど、わいはあんまり同意せんな。
これは全然違うもんやと思うわ。最初のコパイロットはそんなに価値がなかったかもしれんけど、オフィス製品やOutlookにコパイロットを統合するのは、ええアイデアやと思うんや。これは、ソフトウェアを書くっちゅうより、従業員を雇うみたいなもんになると思うんや。
ほな、それについてもうちょっと話そか。
彼は従業員の雇用について話しとったけど、先週、Crew AIのCEOであるJoeと話しとって、エージェントを従業員として雇用することについて話したんや。これは、会社にAIを導入する時にめっちゃ重要なポイントになるんや。
特に、人間の新入社員教育と似たようなもんやって話をしたんや。誰かを雇った時に、何の文脈も、トレーニングも、新入社員教育の資料も与えんかったら、その人は完全に一からスタートせなあかんようになるやろ。そうすると、慣れるまでの期間がめっちゃ長くなってまうんや。
それを短くするには、トレーニングや、文脈、新入社員教育の資料が必要なんや。AIエージェントも同じことやねん。何もない状態から始めたら、全てを都度学習せなあかんし、毎回のプロンプトにめっちゃ詳細な指示を書かなあかんようになるんや。
でも、人間の従業員や同僚と一緒に働く時と同じで、付き合いが長くなればなるほど、お互いの理解が深まって、コミュニケーションが取りやすくなるんや。細かいことを言わんでも、大まかな方向性を示すだけで、相手が理解してくれるようになるやろ。
AIも同じになると思うんや。将来のAIエージェントの重要な部分は、どうやって早く仕事に慣れさせるか、必要な記憶を全部与えるか、ドキュメントへのアクセス権を与えるか、どんな風に応答してほしいか、どんなタスクをやってほしいかを正確に伝えることやと思うんや。そうすれば、スタートした時から即戦力として働けるようになるんやで。
コンピューティングを再発明したいっちゅう野心、今や我々が知っとるような素晴らしい挑戦を作り出したいっちゅう野心があってな。全ての刺激に触発されたり、我々の前にある信じられんくらい大きな挑戦があったりするから、長い間、わくわくしながら突き進んできたんや。
そして今、我々には道具や能力、人工知能っちゅうものがあるんや。これらを使って、子供の頃からずっと興奮してきた他の全ての問題を解決できるんや。そう思うとめっちゃワクワクするやろ。
ほな、我々はコンピューティングの完全なパラダイムシフトの瀬戸際におるんや。
今までのコンピューティングは、あらかじめ書かれたソフトウェアやハードコードされたもんを実行するもんやったけど、これからは必要な時に動的に作られて予測されるソフトウェアになるんや。
もしかしたら、ソフトウェアすら要らんようになって、ユーザーインターフェースだけで、その場で必要なもんを予測して届けてくれるようになるかもしれんな。
これは、コンピューティングについて考える全く新しい方法や。新しいチップ、GPUが必要やし、新しいソフトウェア、モデルの重みも必要になるんや。
こんな時代に生きとって、みんなとこんな話ができるのは本当に興奮するわ。めっちゃクールな時代やと思わへん？
この動画を楽しんでもらえたら嬉しいわ。良かったら「いいね」ボタンを押して、チャンネル登録もよろしくな。また次の動画で会おな！

この記事が気に入ったらサポートをしてみませんか？