見出し画像

NVIDIAが人類労働の終焉を発表(公式!)

15,817 文字

ジェンセン・ワンをステージにお迎えしましょう。NVIDIAの創業者兼CEOです。
皆さん、こんにちは。NVIDIAの人工知能サミットへようこそ。先ほどご覧になったものはすべてシミュレーションでした。アニメーションは一切ありません。NVIDIAはシミュレーション技術企業なのです。私たちは物理学、仮想世界、そして知能をシミュレートします。シミュレーションを通じて、未来を予測するお手伝いをしています。つまり、ある意味でNVIDIAはタイムマシンを作っているのです。
本日は最新の進歩についてお話ししますが、特にこのイベントは日本のエコシステムに焦点を当てています。ここには多くのパートナーの皆様がいらっしゃっています。350のスタートアップ、25万人の開発者、そして何百もの企業があります。私たちは長年にわたって日本に来ています。なぜなら、日本は当社の創業当初から非常に大切な存在だからです。
日本では多くの「初めて」を実現してきました。私たちと協力した最初のゲーム開発者はセガでした。有名な3Dゲーム開発者のスズキさんが、セガの素晴らしい3DゲームをNVIDIA GPUに移植してくれました。また、NVIDIA CUDAを使ってスーパーコンピュータを構築した最初の例も、東京工業大学のTSUBAME 1.2でした。これによってNVIDIAは、GPUを使って科学計算を進歩させることができました。
日本は多くの面でパイオニアでした。特に私たちのモバイルプロセッサの開発において、それは最も大切なプロジェクトの1つであるNintendo Switchにつながりました。
私たちは今、AIの革命という新しい時代の始まりにいます。これは驚くべき技術的変化を伴う新しい産業です。これは重要な時期であり、私たちは日本のエコシステムおよび素晴らしい企業の皆様と協力して、日本にAIをもたらし、皆で一緒にこの素晴らしい機会を活用したいと考えています。
本日ご参加のプラチナパートナーの皆様に感謝申し上げます。GMOインターネットグループ、ヒューレット・パッカード・エンタープライズ、Microsoft Azure、そして三井物産の皆様。また、56の他のスポンサーの皆様、そして本日ご参加の皆様すべてに感謝申し上げます。
NVIDIAは加速コンピューティングを発明しました。これはCPUに取って代わるものではなく、CPUを補完するものです。私たちは実質的に、CPUを置き換えるのではなく、増強することを望んだ唯一のコンピュータ企業でした。これにより、計算負荷の高いワークロードをGPUに移行することができます。CPUとGPUが協力することで、それぞれの最高の能力を発揮することができます。一方は逐次処理に非常に優れており(CPU)、もう一方は並列処理に驚くほど効率的です(GPU)。
これが加速コンピューティングです。単なる並列計算ではなく、CPUとGPUが協力して動作する加速計算なのです。このコンピューティングモデルは世界にとって全く新しいものです。実際、CPUの排他的な使用は1964年から続いています。その後60年の開発を経て、今日私たちが見ているコンピュータ上で動作するものの大部分はCPU上で動作しています。
しかし、コンピューティングモデルに根本的な変化が起きています。これを実現するために、逐次的に動作するCPUソフトウェアを単にGPUに移して並列に動作させることはできません。私たちは完全に新しいアルゴリズムのセットを作る必要がありました。
OpenGLがグラフィックスアプリケーションをグラフィックスプロセッサによる加速に接続できるようにしたように、私たちは多くの領域固有のライブラリを作る必要がありました。OpenGLのような、しかし多くの異なるアプリケーション向けのものです。
以下は、当社が持つ350の異なるライブラリの一部です。その中には非常に重要なものもあります。例えば、計算リソグラフィ用のcuLithoです。チップのマスク作成には多くのレイヤーのため何週間もかかる可能性がありますが、私たちはその計算を数時間に短縮します。
もちろん、チップ製造のサイクルタイムを加速できますが、より重要なのは、より洗練された半導体物理学を進歩させることを可能にする、より高度なリソグラフィアルゴリズムを進歩させることができることです。2ナノメートル、1ナノメートル、そしてそれ以降へと。計算リソグラフィはcuLithoによって加速されます。
QDSSは今日お話しする空間スパースソルバーのためのものです。これは、このコンピュータがCUDAアクセラレータ上で5Gラジオスタックをリアルタイムで実行できるようにする素晴らしい新しいライブラリです。
また、量子シミュレーション用のQDAQ、遺伝子シーケンシング用のParabricks、AIに使用されるベクトルデータベースのインデックス作成とクエリ用のベクトルストレージまたはベクトルデータベース用のCUVS、そしてcuNumericがあります。
cuNumericはデジタル処理ライブラリです。NUMPはデジタル処理ライブラリとして世界で最も人気があり、500万人の異なる開発者が使用し、先月だけで3000万回ダウンロードされました。これは現在、cuNumericによってマルチGPU、マルチノードで完全に加速されています。
また、SQLやPandas、Polarなどの構造化データ処理用のCDF、古典的で非常に複雑な巡回セールスマン問題を何百倍も高速化するQOpt、生物物理学用のModulusやAI用のModulusもあります。
そして、私たちが作成した最も重要なライブラリの1つであるcuDNNは、ディープラーニングスタックの異なるレイヤーを処理するディープニューラルネットワーク用です。
cuDNNを作成し、ディープラーニングを民主化することで、私たちは過去10年間で何か驚くべきことを実現することができました。人工知能と機械学習のスケールを100万倍に増加させることを可能にし、これが今日のChat GPTの信じられないようなブレークスルーを可能にしました。
人工知能の到来は、cuDNNによって可能になった非常に特別なものでした。それはソフトウェアが設計される方法の変化を可能にしました。以前のソフトウェア1.0では、プログラマーがアルゴリズムを記述するコードを書き、入力から出力を予測する関数を作成していました。この人間が書いたコードはCPU上で最もよく動作しました。
ソフトウェア2.0では、コンピュータの驚くべき能力のおかげで、膨大な量の例を提供して、コンピュータ自身が関数を学習し予測することができます。コーディングの代わりに、今や機械学習であり、GPU上で動作するニューラルネットワークです。
GPU上のこれらのニューラルネットワークは現在、新しいオペレーティングシステム、コンピュータを使用する新しい方法となっており、大規模言語モデルが現代のオペレーティングシステムとなっています。
この機械学習アプローチは信じられないほどスケーラブルであることが判明しました。テキスト、デジタル化された言語、音声、画像、ビデオなど、あらゆる種類のものに使用できます。マルチモーダルにもなれます。アミノ酸配列を学習させることもできます。本質的に、大量の観測データがある場合、ほぼすべてを理解させることができます。
最初のステップは、インターネット上の膨大なテキストを研究することでデータの意味を理解することでした。単語、語彙、構文、文法、さらには単語の意味をパターンと関係性を見つけることで理解することができました。
同じアプローチを使用して、今では異なる種類のデータの意味を理解するだけでなく、異なるモダリティを接続することもできます。例えば、「猫」という単語と猫の画像を関連付けることができます。マルチモダリティを学習し、さらには翻訳し、あらゆる種類の知的情報を生成することができます。
作成されている素晴らしいスタートアップとアプリケーションをすべて見ると、それらは次の2つの組み合わせのいずれかに分類できます。テキストからテキストへの変換(合成、質問応答、テキスト生成、ビデオナレーション用)、ビデオからテキストへの変換(字幕用)、画像からテキストへの変換(画像認識用)、テキストから画像への変換(Midjourney のような画像生成用)、テキストからビデオへの変換(Runway MLのようなビデオ作成用)です。
タンパク質からテキストへの変換(タンパク質の機能説明用)、テキストから化学物質への変換(潜在的な薬物の特性説明用)、さらにはビデオとテキストから機械の関節運動への変換(ロボティクス用)まで可能です。
これらの組み合わせの1つ1つが、新しい産業、新しい企業、新しいユースケースを表しており、アプリケーションのカンブリア爆発を引き起こしています。そして、これはまだ始まりに過ぎません。
機械学習の特性の1つは、脳が大きくなればなるほど、そして学習できるデータが多くなればなるほど、よりインテリジェントになるということです。これをスケーリング則と呼んでいます。モデルのサイズ、トレーニングデータの量と質を増やすたびに、インテリジェンスのパフォーマンスは向上します。
業界は毎年モデルのサイズを2倍にしており、これは2倍のデータと4倍の計算を必要とし、次のレベルの人工知能に到達します。私たちはこれをトレーニングスケーリング則と呼んでいます。これには事前トレーニングと事後トレーニングが含まれ、強化学習、人間からのフィードバック、AIからのフィードバックが含まれます。事後トレーニングフェーズで合成データ生成を使用する手法が多くなっています。
Claude StrawberryやOpenAIが発表されたとき、彼らは世界に新しい種類の推論を紹介しました。Chat GPTのように、質問をして1回で回答を得ます。しかし、思考にはしばしば1つのステップ以上が必要であることを私たちは知っています。
複数の計画、選択肢の中から最適なものを選ぶ必要があるかもしれません。私たちが考え、回答を吟味してから答えるように。問題を思考連鎖の中でステップバイステップで分解することができます。
より多くの計算能力を適用することで推論パフォーマンスを向上させるために、私たちが発明した多くの技術があります。これが2番目のスケーリング則、推論スケーリング則につながります。これは単なる次の単語の生成を超えて、思考と計画を含むものです。
これら2つの同時スケーリング則は、非常に大きな計算能力を必要とします。新しい世代ごとに、私たちはパフォーマンスを向上させながら、同じ比率でエネルギー消費とコストを削減しています。したがって、パフォーマンスの向上はコストとエネルギーの削減と正確に等しくなります。
世界が人工知能を採用し続ける中で、私たちのミッション、私たちの責務は、可能な限り急速にパフォーマンスを向上させ続けることです。これによりAIの範囲を拡大し、効率を改善しながら、コストとエネルギー消費を削減します。これが私たちが1年サイクルに移行した理由です。
しかし、AIはチップの問題だけではありません。これらのAIシステムは巨大です。Blackwellシステムがその例です。Blackwellは1つのGPUの名前ですが、システム全体の名前でもあります。
GPU自身は驚くべきもので、2つのBlackwellチップを持ち、それぞれが今まで作られた中で最大のチップで、TSMCの最先端の4ナノメートルノードで製造された1040億のトランジスタを含んでいます。
2つのBlackwellチップは、2つのチップ間に数千の相互接続を持つ10テラバイト/秒の低エネルギーリンクを通じて接続されています。SK HynixとMicronの8つのHBM3Eメモリに接続されており、これらは8テラバイト/秒で共に動作します。
これらのGPUはそれぞれ1テラバイト/秒の別の超低エネルギーリンクでCPUに接続されています。各GPUはNVLink経由で1.8ペタバイト/秒で接続されています。
これは多くのバイト/秒ですが、必要なのです。なぜなら、このシステムは単独では動作できないからです。世界で最も先進的なコンピュータでさえ、人工知能のために単独で動作することはできません。時には何千もの同様のコンピュータと協力して動作する必要があります。単一のコンピュータとして、または異なるクライアントやリクエストに対応するために別々に動作します。
GPUを1つのユニットとして動作させるために、もちろんQuantum-2コネクティビティを備えたネットワークがあり、このGPUを何千もの他のGPUに接続します。しかし、私たちはまた、私の背後にあるラックの中にある数台のGPUを接続できるNVLinkも必要としています。
NVLinkは18ペタバイト/秒で、世界で最も高速なネットワークの35倍の帯域幅を持ち、これらすべてのGPUをこのNVLinkスイッチに接続することを可能にします。1つのラックには9つのNVLinkスイッチがあり、各ラックには72台のこのようなコンピュータがこのバックボーンを通じて接続されています。
これがNVLinkバックボーンです。銅ケーブルで作られており、50ポンドの銅が、NVLinkと呼ばれるこの信じられないI/Oシリーズによって直接駆動されています。このようにコンピュータに接続され、このスイッチはこれらすべてのコンピュータを1つのユニットとして接続します。
結果として、72台のコンピュータが1つの巨大なGPUとして接続されています。ソフトウェアの観点からは、これは単に1つの巨大なチップです。このラックは3000ポンドの重さがあり、120キロワットを消費します。もしこのステージに置けるなら見せたいのですが。これは多くのNintendo Switchに相当する電力を持っています。ポータブルではありませんが、非常に強力です。
これがBlackwellシステムです。私たちはこれを、スーパーポッドとして、あるいは何千ものユニットがQuantum InfiniBandスイッチで接続された巨大なデータセンターとして構成できるように設計しました。
専用のAIファクトリーを望むなら、あるいはNVIDIAの革新的なSpectrum-Xイーサネットシステムを使用して、イーサネット環境に統合することもできます。これらのシステムを使ってAIスーパーコンピュータを構築し、企業のデータセンター、ハイパースケーラー、あるいはエッジ用に構成することができます。
Blackwellシステムは非常に強力なだけでなく、世界のコンピュータインフラストラクチャのあらゆる場所に統合できるよう、驚くほど適応可能です。
Blackwellには、もちろんコンピュータがありますが、より重要なのは、その上で動作するすべてのソフトウェアがなければ、このコンピュータは使用不可能だということです。これらのコンピュータを液冷や配線とともに見ると印象的です。
ここでNVIDIAのソフトウェアスタック、CUDA、NCCL、Megatron、Megatron Core、TensorRT LLM、Triton、長年にわたって作成し、システムに統合してきたすべてのソフトウェアが、世界中のどこでもAIスーパーコンピュータを展開することを可能にします。
そしてもちろん、その上にはユーザーが構築しやすくするAIソフトウェアがあります。では、AIエージェントとは何でしょうか?私たちはさまざまな方法でそれについて話していますが、2種類のAIが非常に人気になると考えています。
1つ目は基本的にデジタルワーカーです。これらのワーカーは理解し、計画し、行動することができます。マーケティングキャンペーンの実行、顧客サービス、製造サプライチェーンの計画立案、チップの最適化、ソフトウェア開発の支援、あるいは医薬品発見産業での研究アシスタントや実験室アシスタントとして働くよう求められることもあります。
おそらく、このエージェントはCEOのチューターとして、あるいは全従業員のチューターとして働くかもしれません。これらのデジタルワーカーAIエージェントは、本質的にデジタル従業員のようなものです。
そして従業員と同様に、トレーニングが必要です。あなたの会社に受け入れるためのデータを作成し、あなたの会社について教え、希望する機能に応じて特定のスキルを教え、学ぶべきことを学んだことを確認するために評価し、要求された仕事を実行していることを確認するために監視し、もちろん展開して実行する必要があります。
彼らにはBlackwellのエネルギー、Blackwellのトークンを提供し、他のエージェントと対話して問題を解決するためにチームとして働きます。
あなたは様々な種類のエージェントを見ることになるでしょう。私たちは企業がAIエージェントを作成しやすくするためのいくつかのツールを作成しました。NVIDIAのエコシステムはサービス部門ではなく、最終製品やソリューションも提供しません。
私たちは、エコシステムがAIを作成、提供、継続的に改善することを可能にする実現技術を提供します。AIエージェントのライフサイクルライブラリ、プラットフォームはNemoと呼ばれます。Nemoには、データの保管からトレーニング、ファインチューニング、合成データ生成、評価、監視まで、私が言及したすべてのステップのためのライブラリがあります。
これらのライブラリは、世界中のワークフローやフレームワークに統合されています。私たちはスタートアップ、アクセンチュアやデロイトなどのサービスプロバイダー、そして世界中の企業と協力しています。
また、ServiceNowなどのソフトウェアベンダーとも協力して、彼らのプラットフォームを使用するエージェントを作成できるようにしています。将来的に、ServiceNowは問題解決を支援するために借りることができる多くのAIエージェント、本質的にデジタル従業員を提供することになります。
SaaS、これらのエージェントは理解し、推論し、計画し、行動することができます。これらは単一のモデルではなく、AIモデルのコレクションまたはシステムです。Nemoはそれらを構築するのに役立ちます。
私たちはまた、事前トレーニングされたAIモデルを作成し、NIMと呼ばれるものにパッケージ化しています。これらは本質的にAIパッケージ化されたマイクロサービスです。かつてソフトウェアはCD-ROMの入った箱で配布されていました。今日、AIはマイクロサービスにパッケージ化され、ソフトウェアはインテリジェントです。
あなたはそれと話すことができます。なぜなら、それはあなたが意味することを理解するからです。このソフトウェアを他のソフトウェアと接続し、このAIを他のAIと接続し、一緒にAIエージェントを作成することができます。
エージェントAIは、複雑な多段階の問題を解決するために洗練された推論と反復的な計画を使用して、すべての企業を変革します。AIエージェントはマーケティングキャンペーンの立ち上げをインスタントインサイトで加速し、サプライチェーン運営を何百万ドルも節約するように最適化し、ソフトウェアセキュリティプロセスを日単位から秒単位に短縮します。
エージェントAIをこれほど強力にし、変革的にしているのは、データを知識に、そして知識を行動に変換する能力です。例えば、デジタルエージェントは研究論文から得られた洞察を使用して個人を教育することができます。
これはNVIDIAのエージェントブループリントを使用して構築されました。これらは、NVIDIAの加速ライブラリ、SDK、AIマイクロサービスを含むリファレンスワークフローです。
こんにちは、私はJamesです。デジタルエージェントは、画像、グラフ、表を含む複雑なデータを含む研究論文のPDFを取り込み、インタラクティブなデジタルヒューマンインターフェースを通じて提供される高レベルの要約を生成します。
気象予報における素晴らしい進歩ですね。新しい生成モデルであるCORDiFの開発は、U-Net回帰モデルと拡散モデルを組み合わせることで、正確な気象パターンの予測における重要な進歩を表しています。
NVIDIAのAIは、企業にプロセスを自動化し、リアルタイムのインサイトにアクセスし、ワークフローの効率を改善する力を与えます。
AIエージェントは3つの要素に基づいています:Nemo、NIM、そしてブループリント。すべてオープンソースで、あなた自身のAIエージェントワークフォースを構築することができます。
これらのエージェントは誰の仕事も100%代替することはできません。しかし、すべてのエージェントは50%の仕事をこなすことができます。これが大きな成功です。50%の人々の仕事を代替すると考えるのではなく、100%の人々の仕事の50%をAIが行うと考えるべきです。
このように考えると、人工知能があなたの企業の生産性とあなた自身の生産性を向上させるのに役立つことがわかります。人々はよく、AIが彼らの仕事を奪うのかと尋ねます。私はいつも、真実だから答えます:AIはあなたの仕事を奪いませんが、他の誰かが使用するAIが奪うでしょう。だから、できるだけ早くAIの使用を有効にしてください。
最初のアプリケーションはデジタルAIエージェントですが、2番目は物理的AIです。同じ基本技術が今や機械システムに組み込まれています。もちろん、ロボティクスは世界で最も重要な産業の1つになるでしょう。
これまで、ロボティクスは制限されていました。実際、ここ日本では、世界の産業用ロボットの50%が川崎重工業、ファナック、安川電機、三菱電機によって製造されています。この4つのリーダーが世界のロボットシステムの半分を製造しています。
ロボットは製造業の生産性を向上させてきましたが、その使用を拡大することは非常に困難でした。ロボット産業は長い間大きく変化していません。なぜなら、それはあまりにも特定的で、異なるシナリオ、条件、作業に適応するには柔軟性が不足しているからです。
私たちは、自己適応し学習できる、はるかに賢いものが必要です。これまで説明してきた技術、エージェントは誰とでも対話できます。
ロボティクスを実現するために、私たちは3つのコンピュータを構築する必要があります。1つ目はトレーニング用、2つ目はシミュレーション用のOmniverse(物理的および仮想世界のデジタルツインを作成するために使用できる仮想世界のデジタルツインスイート)です。
Omniverseで検証、トレーニング、評価した後、モデルをJetson(人型ロボット用に設計された当社のプロセッサ)を搭載した物理的なロボットに転送することができます。このループは無期限に継続します。
AIエージェントのライフサイクルプラットフォームであるNemoがあるように、AIを作成できるOmniverseプラットフォームがあります。最終的に望むのは、AIが世界を見て、ビデオを見て、環境や状況を見て、あなたが望むことを伝えると、そのAIが関節の動きを生成することです。
テキストからビデオを生成したり、薬物のための化学物質を生成したりするのと同じように、関節MV(動き)を生成することができます。このコンセプトは生成AIと非常によく似ています。だからこそ、Omniverseと、私たちが構築したすべてのコンピュータ、これら3つのコンピュータ、そして最新の生成AI技術により、人型ロボットの時代が来たと考えています。
もちろん、人型ロボットのソフトウェア開発は非常に困難です。しかし、利点は驚くべきものです。世界に簡単に展開できるロボットシステムは2つしかありません。1つは自動運転車です。なぜなら私たちは車に適応するように世界を作り変えたからです。そしてもう1つは人型ロボットです。なぜなら私たちは自分たちのために世界を作ったからです。
これは非常に困難な技術であり、その時が来ましたが、影響は大きなものになる可能性があります。
先週のロボティクス学習集会で、私たちはIsaac Labと呼ばれる非常に重要な新しいフレームワークを発表しました。これは、人型ロボットに人型ロボットの振る舞い方を教えることができる仮想強化学習シミュレーションシステムです。
1つ目のワークフローはGroot Mimicです。タスクの実行方法をロボットに示すためのフレームワークです。人間のデモンストレーションを使用し、ドメインランダム化を使用してその環境を模倣し、あなたのデモンストレーションと類似した何百もの他の例を生成します。これにより、ロボットは非常に特定のタスクだけでなく、一般化することを学習できます。
2つ目はGroot Genで、Omniverseの生成AI技術を使用して、ロボットに実行してほしい環境とアクションの大量のランダムな例を作成できます。
3つ目はGroot Controlで、学習したすべてのスキルを取り、それらを統一されたモデルに蒸留できるモデル蒸留フレームワークです。これにより、ロボットは運動学的スキルを実行できます。
ロボットは自律的になるだけでなく、将来の工場もロボット化されることを覚えておきましょう。これらの工場は、機械システムを構築するロボットを調整するロボット工場になります。
物理的AIは、自動運転車のような安全に現実世界を移動するロボット、複雑な産業タスクを実行するマニピュレータ、私たちと協力して作業する人型ロボットに具現化されます。工場や施設は、その運営を監視・調整したり、私たちと会話したりできる物理的AIによって具現化されます。
NVIDIAは、開発者が物理的AIを作成できるようにする3つのコンピュータを構築します。モデルはまずDGX上でトレーニングされ、次にOmniverseで物理的フィードバックを使用した強化学習によってAIが洗練され、テストされます。トレーニングされたAIは、NVIDIA Jetson EGXロボットコンピュータ上で動作します。
NVIDIA Omniverseは、物理的AIシミュレーション用の物理ベースのオペレーティングシステムです。ロボットはIsaac Labで学習し、スキルを洗練します。これはOmniverse上に構築されたロボットジムで、Groot Genのような多様な学習環境を生成するワークフロー、大規模な合成モーション データセットを生成するGroot Mimic、全身ニューラル制御のためのGroot Controlを備えています。
未来の工場は、ロボットチームを調整し、何千ものセンサーを通じてすべての運営を監視します。工場のデジタルツイン用にMEGAと呼ばれるOmniverseブループリントを使用します。
MEGAでは、工場のデジタルツインが仮想ロボットと、それらのAIモデル(ロボットの脳)で満たされます。ロボットは環境を認識し、推論し、次の動きを計画し、最終的にそれを行動に変換することでタスクを実行します。
これらの行動はOmniverseのワールドシミュレータで シミュレートされ、MEGAが工場のデジタルツイン内のすべてのものの状態と位置を正確に追跡し続ける間、ループは継続します。
このソフトウェアテストループは、物理的空間にソフトウェア定義のプロセスをもたらし、産業企業が物理的な世界に展開する前にOmniverseデジタルツインで変更をシミュレートおよび検証できるようにし、リスクとコストを大幅に節約します。
物理的人工知能の時代が到来し、世界の重工業とロボティクスを変革しています。
私たちには2つのロボットシステムがあります。1つはデジタルで、オフィスで従業員と協力するAIエージェントです。もう1つは物理的なシステムであるロボティクスです。
これらの物理的AIは企業が構築する製品になります。企業はAIを使用して従業員の生産性を向上させ、販売する製品に電力を供給します。自動車メーカーは将来2つの工場を持つことになります。1つは車を作るため、もう1つは車で動作するAIを生産するためです。
これがロボット革命です。世界には多くの活動があり、私はAIロボット革命を主導するのに日本以上に適した国を想像できません。
その理由は、皆さんがご存知の通り、この国はロボットを愛しているからです。皆さんはロボットを愛し、世界で最高のロボットの一部を作り出してきました。これらは私たちが育ってきたロボットであり、私たちが一生愛してきたロボットです。
私はお気に入りのいくつかを見せていませんでした。マジンガーZ、ガンダム。私は日本が最新のAI進歩を活用し、それをメカトロニクスの専門知識と組み合わせることを願っています。
世界中で日本以上のメカトロニクス能力を持つ国はありません。これは皆さんが掴まなければならない驚くべき機会です。そして私は、この夢を実現するために一緒に働けることを願っています。
NVIDIAの日本での事業は信じられないほど順調です。ここには大規模言語モデルを構築している多くのパートナーがいます。東京工業大学、楽天、ソフトバンク、直感、NTT、富士通、NC、名古屋大学、Cotoba Technologiesなどです。
また、eist、ソフトバンク、さくらインターネット、GMOインターネットグループ、ハイロー、KDDI、RUTIAなどのAIクラウドもあり、日本のエコシステムが繁栄するためのAIクラウドを構築しています。
多くのロボティクス企業がAIが現在提供する機能を理解し始めています。安川電機、トヨタ、川崎重工業、Rapyutaなどです。
医療イメージングではキヤノン、富士フイルム、オリンパスがこれを活用しています。なぜなら、将来これらの医療機器はより自律的になるからです。医療機器の中にAIナースエージェントがいるようなものです。看護師が診断をガイドするのを助けます。
人工知能を使用する方法は非常に多様です。特に医薬品発見産業では、私はここで達成された進歩に感激しています。
私たちはAI革命を活用するために、さらに速く進みたいと考えています。この産業は、先ほど申し上げたように、根本的に変化しています。CPU上で動作するコーディングから、GPU上で動作する機械学習へと移行しました。
ソフトウェアを生産する産業から、今や人工知能を製造する産業になりました。この人工知能は24時間365日稼働する工場で生産されています。
ソフトウェアライセンスを購入すると、それをコンピュータにインストールし、そのソフトウェアの製造と配布は終了します。しかし、インテリジェンスは決して完全ではありません。
AIエージェントであれロボットAIであれ、すべてのAIと対話します。トークン、インテリジェンスの単位は、インテリジェンスが表現される方法です。それは数字であり、これらの数字はインテリジェンスと言葉になるように構成されています。
このインテリジェンスは、自動運転車のステアリング、人型ロボットを動かすモーター、医薬品発見のためのタンパク質と化学物質にあります。これらすべてのトークンは、これらの工場、これらのインフラストラクチャで生産されています。
これらの工場は以前には存在しませんでした。これは全く新しいものです。だからこそ、私たちは世界中でこれほど多くの開発を目にしているのです。
初めて、私たちは新しい産業、人工知能と呼ばれる全く新しいものを生産する新しい工場を持っています。これらの工場は企業によって構築されます。すべての企業がAIメーカーになるでしょう。
もちろん、どの企業もAIを製造しない、生産しないことは許されません。企業がインテリジェンスを生産しないことをどうして許せるでしょうか?国がそれを許すことができるでしょうか?
チップを生産する必要はありません。ソフトウェアを生産する必要はありません。しかし、インテリジェンスを生産する必要があります。それは不可欠です。それはあなたが何者であるかの核心であり、私たちが何者であるかの核心です。
そして私たちは新しい産業、AIファクトリーを手に入れました。だからこそ、私はこれを新しい産業革命と呼んでいるのです。
これが最後に起こったのは300年前、電気が発見され、その生成と配布が行われ、新しい種類の工場、発電所が作られたときでした。エネルギーと呼ばれる新しい産業が作られました。
数百年前には、エネルギー産業は存在しませんでした。これは産業革命の間に起こりました。今、私たちには以前には存在しなかった新しい産業があります。
人工知能はコンピュータ産業に基づいていますが、それはあらゆる産業によって作られ、創造されています。あなたは自分自身のAIを作る必要があります。製薬産業は自身のAIを作っています。自動車産業は自身のAIを作っています。ロボット産業は自身のAIを作っています。
すべての産業、すべての企業、すべての国が自身のAIを生産する必要があります。新しい産業革命です。
本日、私は非常に大きな発表をします。私たちは、日本にAIインフラストラクチャをもたらし構築するために、ソフトバンクとのパートナーシップを発表します。
一緒に、日本最大のAIファクトリーを建設します。これはNVIDIA DGXから構築され、完成すると25エクサフロップスのAI能力を持つことになります。世界最大のスーパーコンピュータが最近1エクサフロップスだったことを覚えておいてください。これは25エクサフロップスのAIファクトリーになります。
しかし、AIを配布するために、ソフトバンクは先ほど言及した、CUDA上で5Gラジオを動作させるエンジンであるNVIDIA Aerialを統合します。
これを行うことで、5G RANのラジオコンピュータ、ベースバンド、AIコンピュータを統一し、組み合わせることができます。私たちは今、通信ネットワークを進化させ、再発明することができます。
それは音声、データ、ビデオを運ぶことができますが、将来的には、新しい種類の情報であるAIも運ぶことになります。これは、ここ日本のソフトバンクの20万サイト、5500万の顧客に配布されます。
AIを生産するためのAIファクトリー、そしてAIを配布するためのAI配布ネットワーク5G RANs。私たちはまた、新しい種類のストア、AIストアを設置し、ソフトバンクやサードパーティが作成したAIを5500万の顧客に提供できるようにします。
これらのアプリケーションは、先ほどお見せしたNVIDIA AI Enterpriseの上に構築されます。AIをすべての人がアクセス可能にする新しいストアができます。これは素晴らしい開発です。
結果として、日本全体に広がるAIネットワークができます。このAIネットワークはインフラストラクチャの一部となり、最も重要なインフラストラクチャの1つとなります。
覚えておいてください。物を製造し配布するためには、インフラストラクチャに工場と道路が必要です。エネルギーとコミュニケーションも必要です。これはインフラストラクチャの一部です。
インフラストラクチャに根本的に新しいものを作るたびに、新しい産業と企業が生まれ、新しい経済的機会が生まれ、新しい繁栄が生まれます。
道路と工場がなければ、私たちは産業革命を実現できなかったでしょう。エネルギーとコミュニケーションがなければ、コンピュータ革命を実現できなかったでしょう。これらの新しいインフラストラクチャのそれぞれが新しい機会を開くのです。
だからこそ、私はソフトバンクと協力して、これを日本で実現できることに非常に興奮しています。宮川さんのチームは観客の中にいるはずですが、あなたと協力できることは本当に本当に嬉しいです。これは完全に革新的です。
通信ネットワークをAIネットワークに変換する、この種の最初のものです。できることをお見せしましょう。
できる素晴らしいことがあります。例えば、私は基地局の1つ、無線塔の下に立っています。車にはビデオがあり、このビデオはAIを搭載した無線塔に送信されます。この無線塔にはビデオインテリジェンス、視覚インテリジェンスがあるので、車が見ているものを見て、理解することができます。
このAIモデルは車の中に入れるには重すぎるかもしれませんが、基地局に入れるには重すぎません。基地局に送信されるビデオを使用して、車とその環境で何が起こっているかをすべて理解することができます。
これは、人々の安全を確保するためにエッジでAIを使用する一例です。これは自動運転車のための一種の航空管制のようなものです。アプリケーションは無限です。
また、この基本的な概念を使用して、工場全体をAIに変換することもできます。こちらに工場があり、多くのカメラがあります。カメラからのビデオストリームは基地局に送信され、素晴らしいことに、RANのこれらのカメラとAIモデルのおかげで、この工場はAIになりました。
工場に話しかけ、何が起こっているかを尋ね、事故があったか、異常があるか、今日誰かが怪我をしたか、日報を作成できるか尋ねることができます。工場に尋ねるだけでいいのです。なぜなら工場は今やAIになったからです。
このAIモデルは工場内で動作する必要はありません。このAIモデルはソフトバンクの無線で動作することができます。これは別の例ですが、無数の例があります。
あらゆる物理的なオブジェクトをAIに変換することができます。スタジアム、道路、工場、倉庫、オフィス、建物、これらすべてがAIになることができ、Chat GPTと話すのと同じように、単純に話しかけることができます。
「通路の状態はどうですか?障害物や漏れはありますか?」と工場に話しかけるだけです。工場はすべてを観察し、見ているものを理解し、行動を推論し計画するか、単にあなたと話すことができます。
「いいえ、倉庫の通路には障害物、漏れ、危険はありません。ビデオでの通路の状態は、整然として清潔で、障害物や危険がない状態に見えます。」
工場と話をしているのです。これは驚くべきことです。倉庫と話をし、車と話をします。なぜなら、これらすべてが今やインテリジェントになったからです。

いいなと思ったら応援しよう!