AI and The Next Computing Platforms With Jensen Huang and Mark Zuckerberg(翻訳) 4 シェットランドシープドッグ 2024年7月30日 20:09 本稿ではJensen HuangとMark Zuckerbergの両氏によるデンバーで開催されたSIGGRAPH カンファレンス基調講演の下記動画にて日本語訳を行ったものです。内容の精査は出来ておりませんのでご承知おき下さい。 AI and The Next Computing Platforms With Jensen Huang and Mark Zuckerberg NVIDIA founder and CEO Jensen Huang and Meta founder and CEO www.youtube.com 皆さん、特別ゲストをお招きしていますが、座っていただけますか?これから始まりますので。次のゲストですが、私はこの方にとても感銘を受けました。理由は3つある。第一の理由は、文字通り社会基盤の一部として世界中の何十億という人々の生活......に触れ、サービスを発明し、最先端のコンピューティング企業を立ち上げた起業家、創業者は、ほんの一握りしかいないということです。2つ目は、ごく少数の起業家、創業者が会社を設立し、1兆ドル以上の価値に導いたこと。そして3つ、大学中退。この3つは同時に真実である。皆さんようこそ マーク・ザッカーバーグですようこそ初めてのSIGGRAPHへようこそどうも信じられる?コンピューティングのパイオニアの一人で モダン・コンピューティングの立役者彼をSIGGRAPHに招待したんだとにかくマーク、座って。ようこそ。ようこそ。来てくれてありがとう。ああ、いや、きっと楽しいよ。もう5時間もやってるんでしょ?まあ、そうだね。SIGGRAPHは90%が博士号を持っているんだ。SIGGRAPHが本当に素晴らしいのは、ご存知の通り、コンピュータグラフィックス、画像処理、人工知能、ロボット工学を合わせたショーなんだ。ディズニー、ピクサー、アドビ、エピック・ゲームズ、そしてもちろん、ロボットもそうです。エピック・ゲームズ、そしてもちろんエヌビディアは、ここで多くの仕事をしてきました。今年は、人工知能とシミュレーションの交差点で20の論文を紹介しました。人工知能を使って、シミュレーションをより大規模に、より高速に行えるようにしています。例えば、微分可能な物理学です。人工知能のための合成データ生成のためのシミュレーション環境を作るためにシミュレーションを使っています。この2つの領域は、本当に一緒になっています。私たちがここで行ってきた仕事を本当に誇りに思っています。メタの皆さんは、素晴らしいAI研究をされています。つまり、私が面白いと思うことのひとつは、ここ2、3年、メタがいかにAIに飛び込んできたかについてマスコミが書くときだ。まるで、FAIRの仕事がそうであるかのようにね。私たちは皆、メタから生まれたPyTorchを使っています。コンピュータ・ビジョンの研究、言語モデルの研究、リアルタイム翻訳など、画期的な研究です。最初の質問は、メタにおけるジェネレーティブAIの進歩をどのように見ていますか?また、それをどのように応用し、業務を強化したり、新しい機能を導入したりしていますか?そうですね。そこで、たくさんのことをお話ししたいと思います。まず第一に、ここに来られて本当にうれしい。メタは多くの仕事をこなし、8年間SIGGRAPHに参加してきた。だから、君たちと比べたら僕らは初心者だよ。でも、2018年当時だったと思う。あなたは正しい格好をしていますが、これは私のフードです。でも、ここは僕のフードなんだ。2018年だったと思いますが、私たちは初期のハンドトラッキングを披露しました。VRと複合現実感ヘッドセット。コーデック・アバター、つまり消費者向けヘッドセットから駆動できるようにしたい写実的なアバターについての進展については、何度もお話ししたと思います。また、私たちが行ってきたディスプレイ・システムの仕事もたくさんあります。将来のプロトタイプや、複合現実感ヘッドセットの薄型化のための研究などです。そして、それは通常、私たちがここで最初に披露してきたものです。今年は、メタバースに関することだけでなく、AIに関するすべての話をすることができ、とても興奮しています。当時はFacebookで、今はMetaですが、その前にReality Labsを立ち上げました。そして、私たちはしばらくの間、この仕事に携わってきました。ジェネAIにまつわるすべてのことは、興味深い革命です。そしてそれは、私たちが手がけるさまざまな製品を、また違った興味深いものにしていくと思います。つまり、私たちがすでに持っている大きな製品ラインを見てみてください。フィードやレコメンデーションシステム、インスタグラムやフェイスブックなどです。なぜなら、ただ友達をフォローしているときでも、いとこに赤ちゃんが生まれたとか、誰かが本当に重要なことをしたら、それを一番上に表示させたいでしょうし、それがフィードの下の方に埋もれていたら、私たちにかなり腹を立てるでしょう。レコメンデーション・システムは非常に重要で、数百、数千の友人からの潜在的な候補投稿の代わりに、数百万のコンテンツが存在するようになった。そして、ジェネレイティブAIを使えば、インスタグラムで今日目にするコンテンツの大半が、あなたがその人をフォローしているかどうかにかかわらず、あなたの興味にマッチするような、世の中にあるものからあなたに推薦されるだけでなく、将来的には、多くのものがこれらのツールで作成されるようになると思います。そのうちのいくつかは、クリエイターがツールを使って新しいコンテンツを作ることになるだろうし、最終的には、あなたのためにその場で作られるコンテンツや、世の中にあるさまざまなものを組み合わせて合成されたコンテンツになると思う。私たちがやっていることの核心部分のようなものが、どのように進化していくのか、その一例に過ぎない。しかし、それはトランスフォーマーアーキテクチャのようなもので、非構造化データを特徴に埋め込むという一般的な埋め込みをどんどん積み上げていくのと同じようなものだと思います。最近の例では、リールのランキングと推薦のためのモデルと、長編ビデオのランキングと推薦のためのモデルがありました。そして、基本的にシステムが何でも並べて表示できるようにするには、いくつかの製品作業が必要です。しかし、あらゆるものに対応できる一般的なレコメンデーション・モデルを作れば作るほど、どんどん良くなっていきます。その一部は、経済性やコンテンツの流動性、引き出せるプールの広さだと思います。さまざまなプールから引っ張ってくるという奇妙な非効率性がなくなるんだ。でも、モデルが大きくなり、より一般的になればなるほど、それはどんどん良くなっていく。いつか、FacebookやInstagramのすべてが、異なる時間枠で異なる目的を持つ異なるコンテンツタイプやシステムを統合した単一のAIモデルになるような、そんな想像ができるような、そんな日を夢見ています。なぜなら、その一部は、あなたが今日見たい、興味深いコンテンツは何かを示すだけだからです。しかし、そのうちのいくつかは、長期的にネットワークを構築するのに役立ちますよね?知っている人やフォローしたいアカウント。このようなマルチモーダルモデルは、パターンや弱いシグナルなどを認識することに長けている傾向がある。そして、人々がいつも気にすることのひとつは、AIが御社に深く浸透していて、GPUインフラを構築し、大規模なレコメンダー・システムを長い間運用してきたということです。今は...実は、GPUを導入するのが遅かったんだ。ええ、親切心からです。分かってる。まあ、いい人すぎるんだけどね。親切のつもりだったんだ。君は私のゲストだ。バックステージで、僕がここに来る前に、君は自分のミスについて話していたよね?いきなりボランティアでやる必要はない。これはよく試されたと思う。上から目線であしらわれた感じ。でも、ハマった途端、強くハマったよね。置いておこう。これでいい。これでいい。さて、ジェネレーティブAIが本当にクールなのは、最近WhatsAppを使っていると、WhatsAppとコラボしているような気分になることだ。私はイマジンが大好きだ。私がここに座ってタイプしていると、その通りに画像を生成してくれる。戻って、言葉を変える。他のイメージも生成されるんだ。そうだね。中国の老人が日暮れに3匹の犬、ゴールデン・レトリーバー、ゴールデン・ドゥードル、バーニーズ・マウンテン・ドッグと一緒にウイスキーを楽しんでいる。なかなかいい写真だ。ああ、もうすぐだ。これが僕だ。毎月ね。そうそう。そして、今度は実際に僕の写真を載せることができるんだ。実際に僕なんだ。ええ、先週の時点でね。ああ、超楽しみだ。想像してみて。先週から娘たちと一緒に人魚の姿を想像して過ごしているんだ。すごく楽しいよ。でもね、それがもう半分の理由なんだ。つまり、AI世代の多くのものは、一方では、私たちが長い間使ってきたワークフローや製品のすべてを大きくアップグレードするものだと思う。しかし、その一方で、まったく新しいものを生み出すこともできるようになるでしょう。つまり、メタAIです、私たちの世界では、さまざまなタスクを手助けしてくれるAIアシスタントを持つというアイデアは、あなたが言っているように、とてもクリエイティブ志向になるでしょう、あなたがプロンプトを出すと、それに反応する。でも、これからは、あなたが意図を伝えれば、複数の時間枠でその場を離れることができるようになると思います。そして、おそらく、あなたが前もって意図を与えたことを認識するはずです。でも、最終的には、何週間とか何カ月とかかかるような計算ジョブをスピンアップして、世界で何かが起きたときに戻ってくるようになると思うんだ。そして...これは本当に強力なものになると思います。今日のAIは、ご存知のようにターン制のようなものです。あなたが何かを言うと、AIがあなたに何かを返します。しかし、私たちが何かを考えたり、問題を与えられたりすると、複数の選択肢を考えるでしょう。あるいは、選択肢のツリー(意思決定ツリー)を考え出し、その意思決定ツリーに向かって歩きながら、それぞれの意思決定がどのような結果をもたらすかを頭の中でシミュレーションするのです。そうして私たちはプランニングをしているのです。将来的には、AIも同じことをするようになるでしょう。あなたがCreator AIのビジョンについて話したとき、私はとても興奮しました。それを可能にするCreator AIとAI Studioについて教えてください。ええ、実際に、つまり、私たちはこのことについて少し話してきましたが、今日、より広範囲に展開しています。私たちのビジョンの多くは、1つのAIモデルだけになるとは思っていません。そうですね。つまり、この業界の他のいくつかの企業は、1つの中心的なエージェントを構築しているようなものです。つまり、プラットフォーム上にいる何百万というクリエイターであれ、何億という中小企業であれ、最終的には......。すべてのコンテンツを取り込み、ビジネスエージェントを素早く立ち上げ、顧客とやりとりして販売やカスタマーサポートを行えるようにしたいのです。現在、私たちはAI Studioと呼んでいます。これは基本的に一連のツールで、最終的にはすべてのクリエイターが、自分たちのコミュニティが対話できるエージェントやアシスタントのようなAIバージョンを構築できるようにするものです。根本的な問題として、1日の時間が足りないということがありますよね。もしあなたがクリエイターなら、自分のコミュニティともっと関わりたいのに、時間が限られているようなものです。同様に、あなたのコミュニティもあなたと関わりたいと思っていますが、それは難しいことです。つまり、時間が限られているのです。そこで次善の策として、人々が基本的にこれらの成果物を作成できるようにするのです。それはエージェントなのですが、あなたはそれを訓練して、ある種......あなたの素材を使って、あなたが望むようにあなたを表現させるのです。これはとてもクリエイティブな試みで、ほとんどアートやコンテンツのようなものです。しかし、クリエイターがソーシャル・システムでコンテンツを発信するのと同じように、エージェントがそのようなことをできるようになるのは、また別の興味深い方法だと思います。同様に、あらゆる種類の用途のために、人々が基本的に自分自身のエージェントを作成するようなことも起こると思います。あるものはカスタマイズされたユーティリティであり、そのためにエージェントを微調整し、訓練するようなものです。中にはエンターテイメント的なものもあるでしょうし、人々が作るものの中には、ちょっと面白いものや、いろいろな意味でバカバカしいもの、あるいは物事に対する面白い態度のようなものもあるでしょう。そして...私たちが目にしている興味深いユースケースのひとつは、こうしたエージェントをサポートに利用する人々です。これは私にとって少し意外だったのですが、Meta AIの使用例のトップは、基本的に人々が困難な社会的状況をロールプレイするために使用していることです。仕事上の状況であろうと、上司に昇進や昇給をするにはどうしたらいいか聞きたいとか、友人とケンカしたとか、恋人と難しい状況になったとか。でも、多くの人はそうしない。でも、多くの人は、みんなが使っているmetaiやchat gptなどのエージェントと同じように交流したいわけではなく、自分だけのものを作りたいんです。もしあなたがアーティストで、あるスタイルを持っているのなら、あなたのスタイルを取り入れることができる、そして、それがAIモデルになって、あなたが来て、それを促すことができる。私の持っているアートスタイルに沿ったものを作ってほしいと頼むこともできますし、インスピレーションとしてアート作品やドローイング、スケッチを私に渡すこともできます。そして、そのために私のボットを使い、そのために私のAIを使う。将来的には、すべてのレストランやウェブサイトが、このようなAIを導入することになるかもしれない。すべてのビジネスがメールアドレスとウェブサイトとソーシャルメディアのアカウントを持っているように、将来はすべてのビジネスがAIを持つようになると思います。将来的には、どの企業も顧客と接するAIエージェントを持つようになると思います。こうしたことのいくつかは、歴史的にかなり難しいことだったと思います。どの企業について考えてみても、カスタマーサポートは営業とは別の組織として存在しているようなものでしょう。そして、それはあなたがCEOとして望む働き方ではない。ただ、両者は異なるスキルなんだ。あなたが構築しているのは...私はカスタマーサポートです。どうした?あなたが?そうらしいつまり...マークが必要な時は...CEOとして...チャットボットなのか マークなのか...ただのチャットボットですここで聞いているだけです。いや、まあ、CEOになったら、いろいろなことをやらなきゃいけない。でも、抽象化したものを組織に組み込むと、多くの場合、一般的に、組織は別々のものになります。でも、プラトニックな理想としては、組織がひとつにまとまることだと思うんだ。顧客としては、どうでもいい。何かを買おうとしているときと、買ったものに問題があるときとで、別のルートがあるようなことはしたくないでしょう。ただ、質問に答えてもらったり、さまざまな方法でビジネスと関わったりできる場所が欲しいだけなんだ。それはクリエイターにも当てはまると思う。顧客とのエンゲージメント、特にクレームとのエンゲージメントは、あなたの会社をより良いものにしてくれると思います。ええ、その通りです。そうでしょう?このAIと関わることで、組織的な知識を把握することができ、それがすべて分析に反映され、AIを改善することができる。そうですね。このビジネス・バージョンは、もう少し統合が進んでいると思います。しかし、AI Studioを使えば、UGCエージェントやさまざまなものを作成することができます。では、AI Studioを使って自分の画像や画像コレクションを微調整することはできますか?ええ、すぐにできますよ。それから、自分のRAGとして使えるように、自分が書いたものを全部読み込ませることはできますか?そう、そう、基本的にはね。オーケー。そうすると、僕が戻ってくるたびに、またメモリーがロードされるから、前回中断した場所を覚えていて、何事もなかったかのように会話を続けることができるんだ。どんな製品もそうだけど、時間が経てば経つほど良くなるんだ。トレーニングのためのツールも良くなっていく。何を言わせたいかということだけではないんだ。つまり、一般的にクリエイターやビジネスには避けたいトピックがあると思うんだ。だから、そういうことを全部上手くなっていけばいいんだ。これのプラトニックなバージョンって、テキストだけじゃないと思うんだよね。ほとんど...これはコーデック・アバターの仕事と重なる部分があります。基本的には、エージェントとほとんどビデオチャットのようなことができるようにしたいのです。時間が経てば、そうなると思います。しかし、フライホイールは本当に早く回転しています。だからエキサイティングなんだ。新しいものがたくさんある。仮に今、基盤モデルの進歩が止まってしまったとしても、私はそうは思わないが、私たちは......。この5年間は、基本的に業界がこれまでに作られたものを最も効果的に使う方法を見つけるための製品革新の期間だと思う。しかし私は、基礎モデルや基礎研究の進展は加速していると考えている。だから、今はとてもワイルドな時期なんだ。あなたのビジョンはすべて、あなたがこれを実現させたのです。だから、ありがとう。最後の会話で、私はあなたに感謝します。そうだね。我々はCEOだ。私たちは繊細な花なんだ。多くの後ろ盾が必要だ。そうだな。この時点で、私たちはかなり白髪交じりになっている。私たちは、この業界で最も長い歴史を持つ創業者だと思います。その通りだ。本当だ。本当だよ。白髪が増えたね。私のは長くなっただけ。私のは白髪が増えた。あなたのはカールしてるどうしたの?ずっとカールしてた。だから短くしてたんだ。成功するのに時間がかかると知っていたら、始めなかっただろうね。いや、君と同じように大学を中退していただろう。スタートダッシュを切る。それは私たちの性格の良い違いね。私はこう思うんだ。あなたは12年のスタートを切った。結構なことだよ。君はよくやっているよ。これからもやっていけるよ。そう言っておこう。そうだねそうだね。私があなたのビジョンで気に入っているのは、誰もがAIを持つことができるということ、すべてのビジネスがAIを持つことができるということです。私たちの会社では、すべてのエンジニアとソフトウェア開発者にAIを持たせたいと思っています。そうですね。そして、あるいは多くのAIを。あなたのビジョンで私が気に入っているのは、すべての人とすべての企業が独自のAIを作れるようにすべきだと考えていることです。だから実際にオープンソース化した。Llamaをオープンソース化したとき、私は素晴らしいと思いました。ところで、Llama 2.1は昨年のAI界最大のイベントだったと思います。その理由は...つまり、H100のせいだと思ったんだけど...。鶏が先か卵が先か。鶏か卵かの問題だ。みんなそれぞれの役割を果たすんだ。そうだね。どっちが先だった?H100だ。ラマ2はH100じゃなかったんだ。そう、A100だった。ああ、ありがとう。でも、なぜこれが最大の出来事だと言ったかというと、これが登場したことで、あらゆる企業、あらゆる産業が活性化したからです。突然、すべてのヘルスケア企業がAIを構築するようになった。あらゆる企業がAIを開発した。大企業も、中小企業も、新興企業もAIを開発していた。これにより、すべての研究者がAIに再び取り組むことができるようになった。そして今、3.1がリリースされ、興奮が高まっている。私たちは世界中の企業に3.1を提供しています。その興奮は、まさに桁外れだ。そして、あらゆる種類のアプリケーションを可能にすると思います。しかし、あなたのオープンソース哲学について教えてください。それはどこから来たのですか?PyTorchのオープンソース化ですね。ええ。それが今ではAIを実現するフレームワークになっている。今はLama 3.1やLamaをオープンソースにしていますね。その周りにはエコシステムが構築されています。素晴らしいことだと思います。しかし、それはすべてどこから来たのですか?ああ、この多くには多くの歴史がある。つまり、私たちは長い間、多くのオープンソースの仕事をしてきました。その一部は...私たちは、分散コンピューティングのインフラやデータセンターのようなものを構築するために、他のハイテク企業の後にスタートしました。そのため、私たちがそのようなものを構築する頃には、競争上の優位性はなくなっていました。それならいっそのことオープンにしてしまおうということになったんだ。そうすれば、それを取り巻く”エコシステムから恩恵を受けることができる。”そのようなプロジェクトがたくさんありました。最も大きなものはオープン・コンピュートで、サーバーの設計、ネットワークの設計、そして最終的にはデータセンターの設計をすべて公開しました。それが業界標準となることで、すべてのサプライチェーンは基本的にそれを中心に組織化され、すべての人にとってコスト削減につながりました。つまり、それを公開しオープンにすることで、私たちは何十億ドルものコスト削減を実現したのです。また、Open Computeのおかげで、あるデータセンター向けに設計したNVIDIA HGXが、突然すべてのデータセンターで動作するようになりました。これは素晴らしい経験でした。さらに、ReactやPyTorchといったインフラ・ツールでも同様のことができました。ですから、Lamaが登場する頃には、私たちはこれを行うことに前向きになっていたと言えるでしょう。特にAIモデルについては、いくつかの方法があると思います。ひとつは、この20年間、会社でいろいろなものを作ってきて本当に楽しかったということだ。最も困難だったことのひとつは、競合他社のモバイル・プラットフォームを通じてアプリを出荷するという事実をナビゲートしなければならなかったことです。一方では、モバイル・プラットフォームは業界に大きな恩恵をもたらしました。それは素晴らしいことです。その一方で、競合他社を通じて製品を提供しなければならないのは、難しいことです。私は、フェイスブックの最初のバージョンがウェブ上にあり、それがオープンだった時代に育ちました。そして、モバイルへの移行に伴い、そのプラス面は、今では誰もがポケットの中にコンピューターを持っているということです。技術的にはアンドロイドの方が多いんだけど、基本的にはアップルが市場全体を持っていて、利益も全部持っていて、基本的にアンドロイドはアップルの後を追って開発されているようなものだから、アップルがこの世代を勝ち取ったのは明らかだと思う、アップルに比べればずっとオープンなエコシステムだった。そして、Windowsはエコシステムをリードしていた。PCの世代では、基本的にオープンなエコシステムが勝っていた。そして私は、次世代のコンピューティングでは、オープンなエコシステムが勝利し、再びリードするゾーンに戻ることを期待しています。クローズドなものとオープンなものは常に存在します。両方やる理由があると思います。どちらにもメリットがある。私は狂信者ではない。つまり、私たちはクローズドソースのものをやっています。私たちが発表するものすべてがオープンというわけではありません。しかし、一般的に、業界全体が構築しているコンピューティング・プラットフォームにとって、特にソフトウェアがオープンであれば、その価値は大きいと思います。それが私の哲学を形成しています。LamaのAIと、私たちがARとVRで行っている仕事の両方において、私たちは基本的に、複合現実感のために構築しているHorizon OSを、アンドロイドやウィンドウズがそうであったように、オープンなオペレーティング・システムにしようとしています。私たちは基本的に、エコシステムをオープンなものに戻すことを望んでいます。そして、次世代ではオープンなものが勝つだろうと、私はかなり楽観的に考えている。我々としては...つまり、これはある意味利己的なことなんだけど、この会社を立ち上げてからしばらくの間、次の10年、15年に向けて私が考えていることのひとつがあるんだ、ソーシャル・エクスペリエンスを構築するための基本的なテクノロジーを構築できるようにしたいんだ。なぜなら、構築しようとして、プラットフォーム・プロバイダから「それは構築できない」と言われたことがあまりにも多すぎたから。次の世代のために、私たちは構築するつもりです。ああ、いや、ごめん。ごめん。ピーって言ったと思う。ああ20分くらいはいいんだけど、クローズド・プラットフォームの話をされると腹が立つんだ。なあ、いいじゃないか。最高のAIを作ることに専念している人たちがいて、彼らがどんなAIを作ろうとも、それをサービスとして世界に提供している。でも、自分でAIを作りたいなら、自分でAIを作ることもできる。だから、AIを使う能力は、ほら、いろいろある。私はこのジャケットを自分で作りたくない。私はこのジャケットを作ってもらう方が好きだ。何を言ってるかわかる?わかる?そうだね。だから、レザーがオープンソースになり得るという事実は、僕にとっては有益な概念ではない。でも、素晴らしいサービス、信じられないようなサービス、そしてオープンなサービス、オープンな能力を持つことができるという考え方は、基本的に全領域をカバーしていると思うんだ。しかし、3.1で本当に素晴らしかったのは、405B、70B、8Bがあることです。それを合成データ生成に使い、大きなモデルを使って小さなモデルを教えることができる。より大きなモデルはより一般的ですが、よりもろくありません。どんな運用領域や運用コストにもフィットする、より小さなモデルを作ることができるんだ。衛兵に会いましたね。ああ、ラマだ。ラマ・ガード。ガードレールのラマ・ガード。素晴らしい。そして今、あなたがモデルを構築した方法では、それは透明な方法で構築されています。あなたは世界クラスの安全チーム、世界クラスの倫理チームを持っている。もっと透明性の高いモデルを作ることができるはずです。だから、私はその部分が本当に好きなんだ。そうだね。つまり、『Detour』のために脱線する前に考えていたことなんだけど、私たちがそれを構築しているのは、そのようなものを存在させたいからであって、閉鎖的なモデルから切り離したいからではないんだ。でも、これは単に作ることができるソフトウェアの一部とは違うんだ。エコシステムが必要なんだ。だから、オープンソースにしなければ、ほとんどうまくいかないようなものなんだ。私たちは利他的な人間だからやっているのではありません。そして、私たちが作っているものが、その周りに強固なエコシステムを持つことで、最高のものになると思うからやっているんだ。PyTorchのエコシステムにどれだけの人が貢献したか見てください。ええ、その通りです。エンジニアリングの山。そう、そう、そう。NVIDIAだけでも、おそらく数百人がPyTorchの改善に専念しています。PyTorchをより良く、スケーラブルに、より高性能にするためにね。また、何かが業界標準になると、他の人たちもその周辺に取り組むようになりますよね。だから、シリコンもシステムも、結局はこれをうまく動かすように最適化される。これは、本当に効果的であることの一例だと思います。オープンソース戦略は、ビジネス戦略として良いものになると思います。みんなまだよく分かっていないと思う。私たちはオープンソースが大好きです。私たちはオープンソースを中心にエコシステムを構築しました。私たちはこれを構築しました。ええ、見つけました。そう、そう。君たちは素晴らしい。僕らが何かを出荷するたびに、君たちが最初にこれをリリースして、最適化して、機能させてくれた。だから、本当に感謝している。なんて言ったらいいんだろう?僕らには優秀なエンジニアがいる。それでね。あなたたちはいつも、このようなことに素早く取り組んでくれる。それでね。あのね。私は高齢者ですが、機敏です。それがCEOがしなければならないことだ。そして、私は重要なことを認識している。そしてラマは純粋に重要だと思う。私たちは、AIファクトリー、AIファウンドリーと呼ばれるこのコンセプトを構築しました。多くの人々がAIを作りたいという願望を持っています。なぜなら、AIを自社のフライホイール(データ・フライホイール)に組み込めば、自社の組織的知識がエンコードされ、AIに組み込まれるからです。そのため、AIのフライホイール、データのフライホイール、経験のフライホイールを他の場所に置く余裕はない。オープンソースを利用することで、そのようなことが可能になるのですが、どのようにすればAI化できるのかがわからないのです。そこで私たちはAIファウンドリーというものを作りました。私たちはツールを提供し、専門知識、LAMAテクノロジーを提供します。私たちは、彼らがこのすべてをAIサービスに変えるのを助ける能力を持っています。このNIM、ニューロ・マイクロ・エヌビディア・インファレンス・マイクロサービスは、ダウンロードして利用するだけで、オンプレミスを含め、好きな場所で実行することができます。NIMを実行できるOEMから、アクセンチュアのようなGSIまで、パートナーのエコシステム全体があります。実にエキサイティングなことだ。すべてはLAMAのオープンソースに端を発しています。特に、大きなモデルから自分たちのモデルを抽出する手助けをする能力は、本当に価値のある新しいものになると思います。というのも、私たちが製品側について話したように、少なくとも、誰もが話をするような主要なAIエージェントが存在するとは思えないからです。それと同じように、誰もが使うような1つのモデルが存在するとは限りません。チップAI、チップ設計AIがある。ソフトウェア・コーディングAIもある。私たちのソフトウェア・コーディングAIは米ドルを理解しています。私たちにはVerilogを理解するソフトウェアAIがあります。バグ・データベースを理解するソフトウェアAIがあり、バグをトリアージして適切なエンジニアに送る方法を知っています。それで...これらのAIはそれぞれLAMAから微調整されています。そして、私たちはそれらを微調整し、ガードレールを設置します。チップ設計のために設計されたAIがあるとすれば、私たちは政治や宗教などについてAIに尋ねることに興味はありません。だから、私たちはそれを警戒しているのです。ですから、どの企業も基本的には、各機能ごとに、そのために作られたAIを持つことになると思います。そのためには助けが必要なんだ。つまり、将来的に大きな問題のひとつになると思うのですが、人々はどの程度まで大規模で洗練されたモデルを使うのか、それとも自分たちの用途に合わせて独自のモデルをトレーニングするのか、ということです。そして、少なくとも私は、さまざまなモデルが膨大に普及することに賭けている。我々は最大のものを使っている。その理由は、エンジニアの時間がとても貴重だからです。ご存知のように、405Bはどんなに大きなGPUにも入りません。だからこそ、NVLinkの性能が重要なのです。当社のGPUはすべて、NVLinkスイッチと呼ばれるノンブロッキング・スイッチで接続されています。例えばHGXでは、このスイッチが2つあります。そして、これらのGPUがすべて動作し、405Bを走らせることができるようにしています。なぜこのようなことをするかというと、エンジニアの時間は我々にとって非常に貴重だからです。可能な限り最高のモデルを使いたいのです。それが数十円の費用対効果であろうと、誰も気にしない。だから、最高のクオリティの結果を提供したいんだ。そうですね、405はGPT-4Oモデルの推論コストの約半分だと思います。つまり、そのレベルでは、すでに、つまり、かなり優れているんだ。しかし、そうだね、つまり、人々はデバイスで何かをしたり、より小さなモデルを求めているんだと思う。ただ、彼らはそれを縮小しているんだ。だから、それはまったく別のサービスのようなものなんだ。そのAIが動いていて、私たちがそのAIを雇っていることにしてみましょう。チップ設計のAIはおそらく時給10ドルでしょう。そのAIを常時使用し、大勢のエンジニアで共有しているとします。つまり、各エンジニアは、あまりコストのかからないAIを持っていることになります。私たちはエンジニアに多額の報酬を支払っています。私たちにとっては、1時間数ドルで、その人の能力を増幅させることができるのです。納得してもらう必要はない。AIを雇ったことがないのなら、すぐにでも雇いなさい。私たちが言いたいのはそれだけです。次の波について話しましょう。私があなた方の仕事について本当に気に入っていることのひとつに、コンピューター・ビジョンがあります。私たちは今、ビデオでAIモデルをトレーニングし、世界のモデルを理解できるようにしています。私たちのユースケースは、ロボット工学と産業デジタル化で、これらのAIモデルをオムニバースに接続することで、物理世界をよりよくモデル化し、表現できるようにし、オムニバースの世界でよりよく動作するロボットを作ることです。あなたのアプリケーション、レイバン・メタグラスは、バーチャル世界にAIを持ち込むというあなたのビジョンは実に興味深いものです。それについて教えてください。ええ、そうですね。あなたが話しているSegment Anythingモデルですが、実はSIGGRAPHでその次のバージョンであるSegment Anything 2を発表しています。そして、より高速に、より...そうだ。ビデオでも使えるようになりました。これはカウアイ島の牧場の牛だと思う。ちなみに、これらはこう呼ばれています。おいしい、おいしい牛。おいしいマークの牛。さあ、どうぞ。次回はそうしよう。マークが家に来て、一緒にフィリー・チーズステーキを作ったんだ。次回は牛を連れてくるんだそうだね。私はどちらかというと副料理長だった。でも、本当においしかったよ。本当においしかった。スーシェフのコメントオーケー、聞いて。でも、夜が明けたとき、あなたは、十分食べたでしょ?って。もう一個食べられるよ。本当に?普通、お客さんにそういうことを言うときは、礼儀正しく言うものだよ。あなたは礼儀正しかった。私は間違いなく、ええ、もっと作っているわ。もっとチーズを作るんだ。食べきれなかった?普通、お客さんは「ああ、うん、大丈夫だよ。またチーズステーキ作ってよ、ジェンセン。それで、彼がどれだけ強迫神経症なのかを知ってもらうために、チーズステーキの下ごしらえをしているときに、振り返って、マーク、トマトを切って、と言ったんだ。それでマーク、彼にナイフを渡したんだ。僕は正確に切るんだ。彼はトマトを切った。どれもこれもミリ単位で完璧に。でも本当に面白かったのは、私はトマトが全部スライスされて、トランプの山みたいに積み上げられると思っていたんだ。でも振り返ると...彼はもう一皿必要だと言った。その理由は、彼が切ったトマトはどれも互いに触れ合っていなかったからだ。トマトとトマトを切り離したら、もう2度と触れない。そうだ、もし触れ合って欲しかったら、そう言う必要があるだろ?必要なのは...だから俺はただの副料理長なんだ。だから判断しないAIが必要なんだそう、まるで...超クールだ牛の追跡を認識する。牛の追跡を認識するそう、そう。これを使えば、たくさんの楽しいエフェクトを作ることができる。そして、業界全体にわたって、よりシリアスなアプリケーションもたくさん開かれることになる。つまり、科学者はサンゴ礁や自然の生息地、景観の進化などを研究するために、これを使うんだ。しかし、ビデオでこのようなことができ、ゼロショットで、それと対話し、追跡したいことを伝えることができるというのは、とてもクールな研究です。例えば、倉庫にたくさんのカメラがあったとします。倉庫のAIは、起こっていることすべてを監視しています。例えば、積み重なった箱が倒れたとか、誰かが水をこぼしたとか、そういう事故が起きるとします。AIがそれを認識し、テキストを生成し、誰かに送ると、助けがやってくる。そういう使い方もある。もし事故が起きたら、すべてを録画するのではなく、ビデオを1ナノ秒単位で録画し、その瞬間をさかのぼって検索するのではなく、"重要なものだけを録画するのです。"ですから、ビデオ理解モデル、ビデオ言語モデルを持つことは、このような興味深いアプリケーションのために本当に本当に強力なのです。さて、あなたたちはレイの他に何に取り組むつもりですか?教えてください...そうですね、スマートグラスがあります。次のコンピューティング・プラットフォームについて考えるとき、私たちはそれを複合現実感、ヘッドセット、スマートグラスに分けることができると思います。スマートグラスは、人々がそれを理解し、装着するのが簡単だと思います。スマートグラスにアップグレードされるのは、世界で10億人以上になるでしょう。ですから、これはかなり大きなことになるでしょう。VRMRヘッドセットは、ゲームやさまざまな用途で面白いと思う人もいると思います。そうでない人もいる。私の考えでは、VRMRヘッドセットは世界ではその両方になると思います。スマートグラスは携帯電話のようなもので、次のコンピューティング・プラットフォームの常時接続バージョンになると思います。ミックスド・リアリティ・ヘッドセットは、ワークステーションやゲーム機のようなものになると思います。つまり、メガネは非常に小さなフォームファクターなのだ。これには多くの制約があります。携帯電話で同じレベルのコンピューティングができないのと同じです。ちょうどその頃、ジェネレーティブAIのブレークスルーが起こりました。スマートグラスについては、私たちは2つの異なる方向から問題に取り組んできました。一方では、理想的なホログラフィックARメガネに必要な技術を構築してきました。そのために必要なカスタム・シリコンやカスタム・ディスプレイ・スタックなど、あらゆることをやっています。これはメガネなんですよね?ヘッドセットではありません。VRやMRのヘッドセットとは違う。見た目はメガネのようですが、それでも今かけているメガネとはかなりかけ離れています。私たちが作っているレイバンだって、とても薄い。完全なホログラフィックARを実現するために必要な技術をすべて詰め込むことはまだできません。まだかなり高価でしょうが、製品化され始めると思います。私たちが考えたもうひとつの切り口は、見栄えのいいメガネから始めようということです。世界最高の眼鏡メーカーであるエシロール・ルクソティカと提携することで、彼らは基本的に、皆さんが使っているような大きなブランドをすべて持っています。レイバンやオークリー、オリバーピープルズなど、他にもたくさんあります。エシロール・ルックスオティカはそのすべてです。メガネのNVIDIA。彼らはその例えが好きなんじゃないかな。つまり、そう思わない人はいないでしょう。この時点でそう思わない人はいないでしょう。でも、私たちは彼らと一緒にレイバンの開発に取り組んできました。私たちは第2世代に取り組んでいます。そこで目指したのは、フォームファクターを制限して、見栄えのするものにしようということでした。素晴らしいアイデアだ。そしてその中で、技術的には理想的な形にはならないが、最終的には見栄えのするメガネになることを理解した上で、できる限りの技術を投入しよう。現時点では...カメラセンサーがあるので、写真やビデオを撮ることができます。インスタグラムへのライブストリーミングも可能です。WhatsAppでビデオ通話ができ、自分が見ているものを相手にストリーミングできます。マイクとスピーカーも付いています。つまり、スピーカーはとても良いのです。まるでオープンイヤーのようです。多くの人がイヤホンよりも快適だと感じています。音楽も聴けるし、プライベートな体験ができる。それはとてもいいことだよ。みんなそれが好きなんだ。電話もできる。でも、そのセンサーのパッケージが、AIと会話するために必要なものだとわかったんだ。これはある種の偶然だったんだ。もし5年前に、AIよりも先にホログラフィックARが登場するのかと聞かれたら、私は「そうだろうね」と答えたでしょう。グラフィックスの進歩、ディスプレイの進歩、バーチャルリアリティや複合現実感、新しいディスプレイスタックの構築など、私たちはそれに向かって進歩を続けているように思えます。そして、この画期的なことがLLMで起こった。そして、ホログラフィックARを実現する前に、今、本当に高品質のAIがあり、本当に速いスピードで向上していることがわかったのです。つまり、これは私が予想していなかった逆転現象なのです。つまり、私たちは幸いなことに、これらすべての異なる製品に取り組んでいたので、良いポジションにいることができました。しかし、最終的に行き着くのは、さまざまな価格帯の、さまざまな技術レベルの、さまざまなメガネ製品の可能性だと思います。今、レイバンのメタを見ていることから推測すると、300ドルという価格帯のディスプレイレスAIメガネは、最終的には数千万人、数億人が持つような、本当に大きな製品になると思います。そして......超インタラクティブなAIと会話することになる。そうです。今お見せしたような視覚的な言語理解。リアルタイム翻訳もできる。ある言語で話しかけられても、別の言語で聞くことができる。そして、ディスプレイも明らかに素晴らしいものになるでしょうが、メガネに少し重量が増し、値段も高くなるでしょう。ですから、完全なホログラフィック・ディスプレイを望む人はたくさんいると思いますが、最終的には本当に薄いメガネのようなものを望む人もたくさんいると思います。まあ、産業用アプリケーションや一部の作業用アプリケーションでは、それが必要です。消費者向けにも必要だと思うそう思いますか?ええ、つまり、COVIDの期間中、私はこのことをよく考えていました。COVIDの時、みんながちょっとリモートになって、Zoomにずっと時間を費やしているような感じだった。でも、将来的には、バーチャルなミーティングができるようになるのは、そう何年も先のことではないんだ。一緒に何かに取り組んだり、協力したりすることができるんだ。でも、これはAIで特に重要になると思う。常に身に着けているわけではないデバイスと暮らすこともできる。そうだね、でも実際にそうなるところまで行くと思うよ。そうだね。メガネの中にも、細いフレーム、太いフレーム、いろんなスタイルがある。だから、メガネのフォームファクターで完全なホログラフィックメガネを実現するのはまだ先のことだと思う。しかし、スタイリッシュなメガネの中にホログラフィーを取り入れることは可能だと思います。でも、スタイリッシュな...ちょっとかっちりとしたフレームのメガネを持つことは、そう遠い未来ではないと思います。このサングラスは、最近の顔のサイズです。なるほどね。ああ、それでね。とても参考になるスタイルだね。ええ、その通り。とても参考になるスタイルだよ。僕はスタイル・インフルエンサーになりたいんだ。そうすれば、眼鏡が市場に出回る前に、影響を与えることができる。でも、どうだろう。まあ、私はあなたがそれを試みているのを見ることができます。あなたのスタイルへの影響はどうですか?まだ早いよ。ああ、早いね。早いよ。でも、どうだろうね。もし、このビジネスの将来の大きな部分が、人々がかけるようなスタイリッシュなメガネを作ることなのだとしたら、これは私がもう少し注意を払うべきことなのかもしれない。そうだね。そうだね。毎日同じものをかけていた私は引退しなければならない。でも、それがメガネのいいところでもあるんだ。腕時計や...携帯電話もそうだけど、みんな同じものを身につけたくないんだよね。だから、このプラットフォームは、前に話したテーマに戻って、オープンなエコシステムに適していると思います。なぜなら、人々が求めるフォームファクターやスタイルの多様性は、計り知れないものになると思うからです。誰もが同じようなメガネをかけたくないというわけではない......他の誰がデザインしても、それは違う。そうだね。マーク、私たちが今生きているのは、コンピューティングスタック全体が再発明されようとしている時代なんです。アンドレが言うところのソフトウェア1、ソフトウェア2、そして今は基本的にソフトウェア3です。汎用コンピューティングからジェネレイティブ・ニューラル・ネットワーク・プロセッシングへと、コンピューティングの方法が変化している。今、私たちが開発できる能力やアプリケーションは、過去には考えられなかったものです。そしてこの技術、ジェネレーティブAI。これほど速いスピードで消費者、企業、産業、科学に影響を与えたテクノロジーは他に記憶にない。そして、気候変動技術からバイオテクノロジー、物理科学に至るまで、私たちが遭遇するあらゆる分野で、科学のあらゆる異なる分野を横断することができる。ジェネレーティブAIは、まさにその根本的な転換期にある。それに加えて、あなたが話しているようなことは、ジェネレーティブAIが社会に大きな影響を与えるということです。私たちが作っている製品にね。そして、私がとても楽しみにしていることのひとつに、以前誰かに聞かれたのですが、ジェンセンAIが登場するのでしょうか?と聞かれましたが、それはまさにあなたが言っていた創造的なAIです。私が書いたものをすべて搭載し、質問への答え方で微調整する。そして時間が経つにつれて、使い方が蓄積され、質問したり、アイデアを出し合ったりしたい多くの人々にとって、本当に素晴らしいアシスタントであり、仲間になることを願っています。そしてそれは、先ほどあなたが言っていたように、判断力のないジェンセンのバージョンになる。批判されることを恐れない。だから、あなたはいつでもジェンセンと接することができる。でも、でも、本当に信じられないことだと思うんだ。私たちは、いつもたくさんのことを書いていますが、それを3つか4つのトピックにまとめるだけで、どんなに素晴らしいことでしょう。書きたいことの基本的なテーマを決めて、それを自分の声で書いて、それを出発点にするんだ。それで、今できることがたくさんあるんだ。あなたとの仕事は本当に素晴らしい。あなたはデスクトップからモバイル、VR、AI、これらすべてのデバイスにピボットした。見ていて本当に、本当に、本当に素晴らしい。そしてエヌビディアは、私たち自身も何度もピボットしてきました。そして、私たち2人とも、長年にわたって何度も歯ぎしりをしてきました。しかし、それがパイオニアとなり、イノベーションを起こすために必要なことなのです。だから、あなたを見ているのは本当に素晴らしい。そうだね。つまり、以前やっていたことを続けることがピボットなのかどうかはわからないけど、同じように、でも、それに加えていく。つまり、すべてのことにもっと多くの章があるということです。同じように、見ていて楽しいよ。そして、あなたたちはただひたすらこの問題に取り組み続けた。でも、実際には、麻痺させることができるような大きなシステムが必要になるんだ。逆だ。そう、違うんだ。それはつまり...そうなんだ。小型化する代わりに、コンピュータを大型化したんだ。しばらくは流行らなかった。ちょっと流行らない。超流行らない。そう。でも今はクールだ。でも今はクールだ。GPUの代わりにグラフィックチップを作り始めたんだ。そして今、GPUを配備する時、まだHopper H100と呼んでいます。ザックがH100と呼ぶとき、彼のH100のデータセンターには60万台があると思います。私たちは優良顧客です。そうやってSIGGRAPHでジェンセンのQ&Aをゲットするんだ。すごい。ちょっと待って。私はマーク・ザッカーバーグのQ&Aを受けたんだ。君はゲストだマークが...ある日電話してきて 2週間後にSIGGRAPHでやるからって私は、その日は何もやることがないんだ。デンバーを離れてるからね。楽しそうですね。その通り。その日の午後は何もしないよ。あなたはただ現れただけ。でも、君たちが構築したシステムは、本当にすごいよ。巨大なシステムで、オーケストレーションも運用も信じられないほど難しい。あなたは、GPUの旅に参加したのは他の誰よりも遅かったと言いました。見ていて信じられないほどです。本当におめでとう。そして、あなたは今やスタイルのアイコンです。この男を見てください。初期段階だ紳士淑女の皆さん マーク・ザッカーバーグです ありがとう ちょっと待てよ... ...マークと僕はディナーの後 ジャージを交換したんだ... ...それで写真を撮ったんだけど... ...それがバイラルになって... ...彼は僕のジャケットを着るのが 苦にならないんだ。どうだろう。それが僕のルックス?歩けないと思う。そのはずだ。そのはずだ。そうなのか?そうだよ。実は君のために作ったんだ作ったの?作ったの?ああマークのだ私も見てみよう箱がある黒と革と毛皮だ私が作ったんじゃないネットで注文したんだちょっと待ってチリが入ってる"これは俺だ" "こいつにチェーンを" "今度会ったら金塊を" "公平は公平だ" "今年のシググラフを記念して" "ロリが新しいジャケットを買ってくれた" "シググラフはうちの大事なイベントだ" "ここでRTXが発表された" "すごいものが発表されたすごい。それで、またジャージーの入れ替えがあったんだ。そうだね。これは君のものだ。これは中古だから価値があるんだ。見てみようどうかなマークはかなり男前だ彼は......かなりイカしてるお前もだよしみんなジョンとマーク・ザッカーバーグ素晴らしいSIGGRAPHをまたねAI and The Next Computing Platforms With Jensen Huang and Mark Zuckerberg ダウンロード copy #生成AI #nvidia #meta #NVDA #SIGGRAPH 4 この記事が気に入ったらサポートをしてみませんか? サポート