OpenAIの新モデル "o1" は私たちが待ち望んでいた大きな一歩前進なんやろか?

2024年9月14日 19:24

16,862 文字

OpenAIがついに推論モデルをリリースしたんです。コードネームは「ストロベリー」やったんですが、今は公開版として「o1」って呼ばれてるんですわ。今日はこのモデルが何者なんか、どういう意味があるんか、そしてOpenAIとAI業界全体がこれからどうなっていくんかについて、お話しさせていただきます。
今回のゲストホストとして最適な方をお招きしました。パリー・オルソンさんです。ブルームバーグのテクノロジーコラムニストで、今週新刊が出たばかりの著書「Supremacy: AI、ChatGPT、そして世界を変える競争」の著者でもあります。
パリーさん、AIニュースであふれかえってる今週に本を出すなんて、なんというタイミングでしょう。番組へようこそ。
パリー: ありがとうございます。この番組の大ファンなんで、お話しできて光栄です。
司会: こちらこそありがとうございます。そうですね、今週はAppleのニュースが大きな話題になるかと思ってたんですが、水曜日にはもう出し尽くしたような感じで。今となっては、AppleのインテリジェンスやiPhone 16の話なんて、もう遠い昔のことみたいに感じますね。ここ数日で起こったことを考えると。
パリー: その通りです。
司会: それでは大きなニュースに入りましょうか。OpenAIがこの「ストロベリー」モデルをリリースするという噂は前々から聞こえてきてましたね。当初は「Q*」って呼ばれてて、サム・オールトマンの解任騒動の頃にはこのモデルを巡って心配の声も上がってました。
で、このモデルが登場したわけなんですが、一番の特徴は推論能力があるってことなんです。質問をすると、問題を考える過程を実際に見ることができるんです。いくつもの段階を踏んで考えていくのが分かるんですね。
これによって、今までのどのモデルよりも正確で、有能で、賢くなったんです。OpenAIがリリースと同時に公開したチャートを見てたんですが、正確性のスコアを見てみると...
例えば数学のコンペティションでいうと、GPT-4.0は13.4%の正確性しかなかったんです。でもこの新しいモデルは、問題の考え方を段階的に示せるようになったおかげで、なんと83.3%もの正確性を達成したんです。13.4%から83.3%へのジャンプですよ。
コンペティションのコーディングでは11%から89%に跳ね上がりました。PhD レベルの科学の質問になると、GPT-4.0も56%とそこまで悪くなかったんですが、新しいo1は78%、o1プレビュー版は78.3%の正確性を示しました。ちなみに人間の専門家で69.7%なんです。
これは正解率のパーセンテージだと思うんですが、パリーさん、このモデルのリリースについてどう思われます? 噂に違わぬものだったんでしょうか? サム・オールトマンがOpenAIから追放されたのも、こういうタイプのモデルの扱いに慎重じゃなかったからだっていう憶測もありましたよね。これらのモデルは本当に大きな一歩前進なんでしょうか? リリースについてどうお考えですか?
パリー: まず、OpenAIがここ1年ほど、すごいプレッシャーを受けてたってことを考えないとアカンと思います。2022年11月にChatGPTが出て、その前のDALL-Eもそうでしたが、あれほどの衝撃を与えるようなものを出さなアカンっていうプレッシャーですね。
ここ数ヶ月の様子を見てて面白かったのは、OpenAIがいろんなものを発表はしてるけど、実際にリリースしてるわけじゃないってことでした。例えば、あのSoraの動画生成技術とかありましたよね。
司会: あれどうなったんでしょうね。
パリー: そうそう、どこ行ったんやろって感じですよね。GPT-4の音声対話インターフェースだって、まだ完全にロールアウトされてへんみたいで。先週サンフランシスコで会った人たちも「まだ試せてへんわ」って言うてました。
司会: そのことについて少し。私もずっとChatGPTのプレミアム会員で、新しい音声インターフェースが使えるようになるのを待ってたんですが、まだ来ないんです。
この24時間ほど、ストロベリーとo1のリリースに関する話題を追ってたんですが、一番おもしろかったやりとりがあるんです。サム・オールトマンが「ロールアウト完了。ChatGPTプラスとチームユーザーの100%に公開された」って発表したんです。新しい推論モデルについてですね。
それに対する最初の返信が、マット・ポールっていう人から「新しい音声機能はいつ来るんですか?」っていうものだったんです。要するに「最初に言ってた機能、いつになったらできるんですか?」って。
サム・オールトマンの返事が「まず2週間くらい、空から降ってきた魔法の知能に感謝してから、また新しいおもちゃをあげましょう」みたいな。
パリー: まあ...面白いですけど、同時にサムと彼の会社が自分で作り出した状況をよく表してますよね。デモ版をたくさんリリースして、みんなをワクワクさせすぎたんです。でも、長い間ワクワクさせすぎて、何も与えへんかったら、人々はイライラし始めて、舞台裏で何が起こってるんか疑うようになるわけです。
面白いのは、あなたも私も同じように、プレミアム会員になってるってことですね。私もClaudeに登録してて、2つのサブスクリプションに課金してるんです。でもChatGPTプラスは音声インターフェースを試したくて残してるんです。でも、まだスマホに出てこないんですよね。
司会: そうなんです。私も音声機能をずっと待ってたんですが、結局来なかったんで、プラスの契約を解除しちゃったんです。偶然なんですが、私の契約が切れるのが今日なんです。だから、GPT-4のo1を試すことはできたんですが、音声はまだですね。契約終了まであと12時間くらいですかね。
パリー: そうですね、月間の上限があるんでしたっけ? 週間の上限?
司会: はい、小さな上限があるんです。でも私、正直言って制限なんて気にせずにテストしまくってました。「どうせ契約切れるし」って感じで。
初期の感想を共有させてもらうと、このモデルは数学とコードに特化してるんじゃないかって気がするんです。実際のブレークスルーはそこにあるんじゃないかって。
さっき言ったベンチマークを見ても、数学のコンペティション、コーディングのコンペティション、PhD レベルの科学の質問で際立った成果を上げてるんです。クエリを実行する時、実際にモデルが一時停止して考えてる様子が見えるんです。「考えてる」って言葉を使うのはちょっと気が引けますが...各段階を一つずつ取り組んでいく様子が見えるんです。
実際、消費者の好みを見てみると、新しいo1プレビューモデルとGPT-4.0を比較した時、個人的な文章作成ではGPT-4.0の方が好まれてるんです。テキスト編集ではほぼ同じくらいなんですが、o1モデルが本当に輝くのは、コンピュータープログラミング、データ分析、数学的計算なんです。そこではずっと好まれてます。
だから、これが一歩前進かどうか判断する時、より技術的な活動に使う人たちは大きな飛躍を感じるでしょうが、文章作成や編集のような用途で使う人たちはそれほど違いを感じないかもしれません。
ジャーナリストの間でこのモデルを低く評価する傾向があるかもしれませんが、技術分野の人たちは本当の進歩を感じてるんじゃないかと。
パリーさん、これについてどう思われますか? 先ほどの質問に戻りますが、OpenAIがプレッシャーを感じてるのは分かりますが、これをどう見るべきでしょうか? 約束された一歩前進なんでしょうか?
パリー: あなたが今説明してくれたことは、良い戦略だと思います。このモデルが、データ分析をしたり、科学者やコーダーのような人たちにとってより有用だとしたら、彼らにとってより明確な有用性を持つ特定のモデルができたってことですよね。
一方で、マーケティングや顧客サービスの分野にいる人たちは、GPT-4.0のような、より言語指向のモデルを使う可能性が高いでしょう。推論指向のモデルよりもね。
ビジネスユースケースの観点から見ると、これは悪くないと思います。これまで、人間の心と同じような広範な認知能力を持つ人工知能を作ろうっていう野心があったわけです。それがOpenAIの設立理念でしたよね。
でも実際にそういうものをビジネスに売ろうとすると、大きなデメリットがあるんです。つまり、スイスアーミーナイフのようなツールを顧客に与えることになるわけです。一般的な能力をたくさん持ってるけど、結局エンドユーザーは何に使えばいいのか決められなくなっちゃうんです。
生成AIモデルの使い方を模索してるビジネスの話を聞くと、例えばある銀行は従業員にアンケートを取って「生成AIをどう使うべきか」って聞いたら、1000以上の回答が返ってきたそうです。それ自体は素晴らしいことなんですが、逆に戦略を決めるのに時間がかかっちゃうんですよね。
あなたの説明を聞いてると、モデルが少し細分化され始めてるように聞こえます。これからは、数学的なプロセスやデータ分析にはこのタイプのモデル、言語処理にはこのタイプのモデルって感じになるかもしれません。
それって、元々の「広範な、神のような一般的知能のAIを作ろう」っていう理念とは逆行してるかもしれません。でも実用的に考えると、むしろ理にかなってるんじゃないでしょうか。
司会: イリヤたちは、こういう能力に脅威を感じてたんでしょうかね。あなたの話し方からすると、それは少し早計だったんじゃないかって感じがしますが。
パリー: ああ、そうですね。OpenAIから出てくるものの多くが、完全に誇張されてたり間違ってたりするんです。例えば、サム・オールトマンが解雇された時、彼を解雇した取締役たちが熱心な実効的利他主義者で、人類のAIに対する安全性を心配するあまり、ほと�宗教的な熱狂に駆られてサムを解雇したっていう噂が飛び交いましたよね。
でも、本当のことを知ってるはずの人たちから聞いた話では、それは全然違うらしいんです。実際の理由は、取締役会がサムの言うことを信用できなくなったからなんです。彼が信頼できる情報源じゃなくなったってことですね。
それも取締役だけじゃなくて、トップ経営陣も同じように感じてたみたいです。
司会: それって...変な理由ですよね。確かに、CEOが嘘をつくのは良くないですけど、明らかな悪い行動があったわけでもないし、会社は順調だったわけですよね。私、彼に甘すぎるんでしょうか?
パリー: ちょっとそうかもしれませんね。だって、取締役会だけじゃなくて、トップ経営陣も懸念してたって話ですからね。私が話した人たちによると。でも、イリヤはこれについて後で撤回して謝罪したので、そこまで強く信じてたわけでもないんかもしれませんね。あなたはどう思います?
司会: そうですね...公の場で言うことと、実際に考えてることや、閉じた場所で言うことが違う理由は分からへんですね。ただ、何が賭けられてるかを考えたら...数十億ドル、信じられんレベルの名声、もしかしたらノーベル賞かもしれへん。そんな環境で正直さを期待するのは難しいかもしれませんね。
パリー: そうですね。
司会: じゃあ、話を戻しましょう。このモデルの使用例についてです。o1、つまりストロベリーがリリースされて、私が考えてたのは「モデルは賢くなった。でも応用はどうなるんやろ?」ってことなんです。
あなたもそのことに触れてましたよね。AIの業界は明らかにうまくいってるんですが、それでも悩んでるんです。モデルは賢くなって、魔法みたいなことができるようになった。でも実際にどう使えばいいのか、まだよく分かってへんのです。
面白いことに、Grokのエンジニアがこんなこと言うてました。「o1は強力そうやけど、みんなどう使えばいいか分からんみたいやな。これまでの憶測を考えるとちょっと滑稽やな」って。
科学やコーディング、数学の分野でモデルが賢くなるにつれて、どうなっていくと思います? OpenAIの研究責任者、ボブ・マクガウンがThe Vergeで言うてたんですが:
「私たちは何ヶ月もの間、推論に取り組んできました。これが実際にブレイクスルーになると考えているからです。基本的に、これはモデルにとって新しいモダリティです。人間レベルの知能に近づくために必要な、本当に難しい問題を解決するためには、これが不可欠なんです。」
パリーさん、これがエージェントへの一歩だと思いますか? そして、なぜ推論が、マクガウンの言葉を借りれば「重要なブレークスルー」なんでしょうか?
パリー: さっきあなたが説明してくれた、誰かのツイートの内容を聞いてると、o1にはほとんどエージェント的な特性があるように聞こえましたね。
推論が重要な理由...うーん、これによってモデルの能力がより広がるってことやと思います。面白いのは、OpenAIの発表の中で「エージェント」って言葉が一度も使われてへんことですね。科学者たちも言及してないみたいです。
ブルームバーグがOpenAIの未来予想図みたいなの出してたの知ってます? 5段階あって、レベル1がチャットボット、レベル2が推論、レベル3がエージェント、レベル4がAIが革新を起こす、レベル5がAIが組織レベルの仕事をするって感じです。
つまり、今はレベル2で、次はエージェントってことになりますね。
司会: そうそう。
パリー: OpenAIのブログ投稿で興味深かったのは、o1の使用例を挙げてるところです。例えば「ヘルスケア研究者が細胞シーケンシングデータに注釈を付けるのに使える」とか「物理学者が量子光学に必要な複雑な数式を生成するのに使える」とか...かなり具体的で技術的なことを挙げてるんです。
そして最後に「あらゆる分野の開発者が複数のステップを含むワークフローを構築し実行するのに使える」って。これはもう、何でもありって感じですよね。
具体的な例から、「まあ、何にでも使えるよ」みたいな感じになってる。だから、あなたが話してた人が「次の四半期にはこれがEBITDAに反映される」って言ったのも、分からんでもないです。多分間違ってると思いますけど。
司会: ほぼ確実に間違ってますね。
パリー: でも、なぜそう考えるのか分かりますよね。これは私たちの経済の中でも、非常に労働集約的で高付加価値なタスクに適用されるってことです。
でも、ビジネスの間では既にモデルの「ハルシネーション」(幻覚)について懸念が広がってますよね。これらのモデルに行動を起こす能力を与えるとなると...
昨日、Salesforceの例を聞いたんですが、顧客サービスチャットボットにエージェントを組み込んで、データを取得して顧客サービス担当者と同じように問題を解決できるようにしたそうです。
これってモデルにもっと信頼を置くってことですよね。情報を間違えるのと、実際に苦情を解決したりする過程を台無しにするのとでは、話が違います。後者の方がリスクが高いです。
正直、これがどう展開していくか全く分かりません。これまでハルシネーションについてかなり懸念があったので、ビジネスはかなり慎重になると思います。
司会: そうですね。OpenAIもブログ投稿で、これでハルシネーションが解決されるわけではないって言ってますしね。
批評家たちの反応を見てみると...まあ、お祭り騒ぎですよ。エド・ジットロンはこう言ってます:
「大きくて馬鹿げた手品が来ましたね、みなさん。ストロベリー、OpenAIの新モデルです。10〜20秒かけて、ちょっとマシな答えを出すけど、バグだらけです。OpenAIは必死になってて、これは本当にヤバイやつです。」
ちょっと言い過ぎな気もしますが、どう思います?
パリー: そうですね、ちょっと言い過ぎですね。昨夜、これを試した人と話したんですが、私自身はまだ試せてないんです。その人はこういうモデルをよく試す人なんですが、大きなアップグレードや大きな変化は感じられなかったって言ってました。AnthropicのClaudeと比べても、特に大きな違いは感じなかったそうです。
でも、私自身も試してみる必要がありますね。昨夜発表されたばかりなので、判断するのは難しいです。みんなで試して、遊んでみることはできますが、これが本当に役立つかどうかは、人々が実際の仕事で使い始めてから分かると思います。
司会: そうですね。では最後に、ちょっと不公平な質問をさせてください。ストロベリーやo1の噂、買いますか、売りますか?
私から先に言いますね。私は買いです。「言葉を扱う人」より「形を回転させる人」、つまりテキストを扱う人より数字を扱う人にとっては難しいかもしれません。でも、これは必要なステップだったと思います。
ベンチマークの改善を見ても分かりますし、すぐにこの形になるわけではないでしょう。例えば、コード補完が最初は「まあ、コードを補完できる」程度だったのが、今では自力でコードを書けるようになってきてるのと同じです。
技術分野の人たちが使うようになって、実際にかなりの進歩になると思います。あなたはどうですか? 買い? 売り?
パリー: うーん、まだ試してないので売りかな。あと、あなたに対して反対の立場を取りたいっていうのもありますけど(笑)
いや、難しい質問ですね。とりあえず今のところは売りって言っておきます。
このベンチマークの件なんですが、私自身、ベンチマークが何に対して重み付けされてるのか、どこから来てるのか、業界全体で完全に標準化されてるのかがよく分かってないんです。
確かに印象的な数字ではあるんですが、実際に何を意味してるんでしょうか。繰り返しになりますが、実際に試してみないと判断するのは難しいですね。
司会: そうですね。もう一つ、私の意見を裏付ける証拠を挙げさせてください。これも不公平かもしれませんが...
o1を自分の個人的なベンチマークでテストした人たちのスレッドを見てたんです。多くの人が自分なりのAIテストを持ってるんですが、一人また一人と、これが以前のテストよりもずっと優れてるって言ってるんです。
パリー: なるほど。でも、これはプレビュー版ですよね。あなたも言ってたし、私も同意見なんですが、Soraの件もそうだし、GPT-4の音声アプリケーションもそうで、まだ状況が不透明なところがあります。
「空から降ってきた魔法の知能に2週間くらい感謝して、そしたらまた新しいおもちゃをあげる」なんてサム・オールトマンが言ってましたけど、そんなの受け入れられませんよね。
司会: そうですね、全くもって。
パリー: でも、全てを考慮に入れても、サム・オールトマンとOpenAIは舞台裏で「本当に重要なことに集中しなきゃ」って気づいたのかもしれません。
あの3つのこと...音声インターフェース、Sora、そして推論能力。もし私がこの3つから選ぶとしたら、間違いなく推論能力が一番大事です。
だから、舞台裏では他の2つを一時停止して、こっちに集中したのかもしれません。なぜそう思うかというと、先週シリコンバレーで何人かと話したんですが、サム・オールトマンの一般的な集中力の欠如について懸念が高まってるって話をよく聞いたんです。
彼は体系的でないし、あまりにも多くのことに手を出しすぎてるって。あるベンチャーキャピタリストは、その週末にサム・オールトマンに会う予定だって言ってて、私が「もし一つアドバイスできるとしたら何を言う?」って聞いたら、こう答えたんです。
「今やってることを全部見直して、2つだけ選んで、それに集中しろって言うね。そのうちの1つが例のでかいチップインフラのプロジェクトでもいい。でも、あとは1つだけにして、他は全部やめろって。」
OpenAIがあまりにも多くのことに手を出しすぎてるって懸念があるみたいなんです。
だから、ストロベリーとo1を軽く見ない方がいいかもしれません。もしかしたら、もっとハイステークスな賭けに集中する必要があるって気づいたのかもしれないですからね。
司会: パリーさん、説得力ありますね。OpenAIはダメになったって噂や憶測が飛び交ってましたからね。「優秀な人材が流出した」とか「イーロンが去って10億ドル調達した」とか「ジョン・シュルマンがAnthropicに行った」とか。
リーダーシップチームが薄くなって、スタッフの大量流出があって、OpenAIは自滅したって。
でも今回のことで、はっきりとは言えないまでも、かなりの自信を持って言えるのは、この会社はまだ最先端を押し進めてるってことですね。
さっきもHuman Evaluation of AI Systemsっていうチャットボット対決サイトを見てたんですが、そこではGPT-4.0がまだトップなんです。
パリー: へえ、Claudeよりも上なんですか?
司会: ああ、全然上です。実はGeminiが2位で、人々が一番良いと思うものに投票するんです。まあ、人為的な操作があるかもしれませんが、それでもOpenAIの終焉が早まって報告されたと思います。
競争は激しいですよ、それは間違いないです。でも、彼らはまだ死んでないですね。
パリー: そうですね。それに、もっとお金も欲しがってますしね。
司会: そうそう、次の話題に繋がりますね。ブルームバーグの報道によると、OpenAIの資金調達で会社の評価額が1500億ドルになるそうです。数週間前の番組では1000億ドルって話してましたけど。
ブルームバーグによると、投資家から65億ドル、銀行からの借入で50億ドル、合計110億ドルを調達しようとしてるらしいです。
以前の番組でも話しましたが、Thrive Capital、Microsoft、NVIDIA、Appleが関わってるみたいです。
パリーさん、この企業について本を書かれましたよね。これだけのお金を集めて、こんな巨額の評価を受けながら、まだ非営利団体であり続けるってどういうことなんでしょう? そんなことが可能なんですか?
パリー: いや、もう非営利団体ちゃいますよ。営利企業なんです。数週間前に出た報告では、OpenAIの経営陣の中に、もっと投資家に優しい形に会社を再編したいって意見があるらしいです。つまり、さらに営利企業の方向に進もうってことですね。
今のところ非営利的な要素があるとしたら、非営利の取締役会があって、普通の会社では考えられないくらい大きな権力を持ってるってことくらいです。例えば、CEOを解雇する権限がありました。まあ、本当にあったんかどうかは分かりませんけどね。結局、サムは戻ってきましたからね。
私の本で言いたかったのは、ChatGPTが出た時、サム・オールトマンとデミス・ハサビスっていう二人が、人工知能を作るライバルになってたことがすごく面白かったってことなんです。
二人とも最初は本当に人道的な目標を持ってました。がんを治す、気候変動を解決する...サムは人々の富を増やしたいって言ってました。
でも、お金がフォーカスになってくると、それらの目標を守り続けるのが難しくなったんです。AIを作るのにすごくお金がかかるから。結局、大手テック企業の引力に引き込まれちゃったんです。
二人とも最初から、この技術を守って、悪用されないようにしなきゃいけないって分かってたんです。だからサムはOpenAIを非営利で始めようとしたし、デミスもGoogleから独立して非営利みたいな形にしようとしました。何年もかけて、たくさんのお金と時間を使ってね。
でも二人とも、責任ある統治の構造を作ることに失敗しちゃったんです。私の本は基本的にそういう統治の話なんです。まあ、そんなタイトルじゃ誰も本を買ってくれへんから使わなかったけど(笑)
結局、この技術は今、ほんの一握りの大手テック企業に支配されてて、規制の空白地帯にあるんです。ちゃんとした監視もない。人々は監視を設けようとしたけど、私たちの社会はイノベーションと適切な監視のバランスを取る方法を見つけられなかったんです。
司会: じゃあ、このお金は何に使われるんでしょうか? この評価額を正当化できるんですかね? 今はたくさんのお金を失ってますよね。投資する側から見て、ビジネスとしてはどうなんでしょう?
パリー: まあ、Microsoftとの収益分配契約がありますからね。Azureを通じてです。だからAzureが上手くいけば、OpenAIもかなりいい線いくでしょう。
サブスクリプションビジネスもかなり安定してます。ChatGPTのアクティブユーザーが2億人くらいいるって聞きました。悪くないビジネスですよ。長期的に見れば、かなり印象的な規模になる可能性はありますね。
Amazonだって、利益が出るようになるまで何年もかかりましたからね。人々はOpenAIのことも同じように見てるのかもしれません。
問題は、ご存知の通り、基盤モデルの構築と改善にものすごくお金がかかるってことです。コンピューティングパワーだけじゃなくて、給料もね。上級AIの科学者やエンジニアの給料ってどれくらいだと思います?
司会: どうなんでしょう。ある組織の人と話したんですが、給与について質問してたみたいで。中堅くらいのAIスタートアップで、上級AIの幹部クラスの給与を聞いたら、4年間で600万ドルくらいだって。
他のところでは、年200〜300万ドルくらいって聞きましたね。時間をかけてのオプションも含めて。
パリー: そうそう。で、お金を取り戻す方法の一つとして、これらのボットのサブスクリプション料金を上げることを考えてるみたいです。今のところ、ボットではお金を稼いでないですからね。
The Informationの今週の報道によると、OpenAI内部の議論で、月額2000ドルまでのサブスクリプション料金が検討されてるそうです。
つまり、今週リリースされた新しい推論モデル、プレビューとミニですね。OpenAIが持ってるモデルで、いずれ製品に組み込まれるだろうと思われるやつです。
このモデルが本当にベンチマークの改善を実現して、いくつかのケースで超有用になれば、もっと高い料金を請求できるかもしれない。これが評価額を正当化する一つの方法かもしれませんね。
司会: でも、そんな高額にはならないと思いますけどね。でも大きな数字が飛び交うのは分かります。
去年、OpenAIと密接に仕事してるAI企業の人と話したんですが、「ああ、サムとOpenAIは新しい資金調達ラウンドをやってるよ。1000億ドル調達しようとしてる」って。
私は「1000億ドルの評価額ってこと?」って聞いたんですが、「いや、実際に1000億ドル調達しようとしてる」って。確認はできなかったんですが、大きな数字がよく飛び交ってるんだなって感じました。
パリー: そうそう、いい例ですね。あの1兆ドルのチップの話とか...7兆ドルでしたっけ?
司会: そうそう、7兆ドルでした。
パリー: OpenAIに関しては、とんでもなく大きな数字がよく飛び交ってるみたいですね。OpenAI内部でもそうかもしれません。
でも基本的に、料金を上げる必要はあるでしょうね。私たち二人ともClaudeとChatGPTの両方に課金してるわけですから。まあ、手頃な価格だからですけど。
でも、もしこれらのシステムが仕事のプロセスに不可欠になるような機能を追加すれば、料金を上げても許されるかもしれません。そうなれば、高い料金でも払わざるを得なくなるかもしれませんね。
司会: NVIDIAやApple、Microsoftがこの資金調達ラウンドに参加してる理由の一つは、たとえ投資金を回収できなくても、OpenAIが最先端を押し進め続ければ、彼らの評価額も上がるからじゃないでしょうか。
賢い投資というか...OpenAIが「投資するなら寄付だと思ってください」って言った時期がありましたよね。これらの企業にとっては、それでもいいのかもしれません。うまくいけば彼らにとってもプラスになるし、何より彼らには余裕があるからです。
パリー: そうですね。Appleだって、EUのアイルランド税金問題で130億ドルをエスクロー口座に入れろって言われましたけど、彼らにとっては小銭みたいなもんですからね。
今のAI業界の最前線にいて、2年前にAIブームの火付け役になった会社への投資なら、彼らにとっては十分価値があるでしょうね。
司会: もう一つ資金調達について質問があります。時々、OpenAIがカタールやサウジアラビアみたいな湾岸の産油国から資金調達しようとしてるって噂を聞くんですが...
世界に利益をもたらすAIを作るっていう使命で始まった会社が、「石油の寡頭政治」や権威主義的な国に株式を与えるのは面白いなと思って。これについてどう思います?
パリー: うーん、中東の石油寡頭政治と組むか、西洋のテック企業の寡頭政治と組むか、どっちを選ぶ? って感じですね(笑)
私なら技術系を選びますけど。まあ、世界のどの地域にいるか、どんな世界観を持ってるかによって違うでしょうね。
でも、あそこにはたくさんのお金があるんです。ソブリン・ウェルス・ファンドがあるから、リスクの高い投資にも大きな賭けができる。
ドバイやUAEは、石油への依存から脱却して、よりテクノロジーベースの経済に移行しようと大きく動いてます。だから、こういうものに投資するのは彼らにとって全く理にかなってると思います。
司会: あなたはこれらの企業をかなり近くで見てきましたよね、本も書いて。いつかは行き詰まる時が来るんでしょうか? これは持続可能なんでしょうか? モデルのトレーニングにこれだけのお金をかけ続けるのは...AIはすごく資本集約的ですからね。
使用例を見つけるのに時間がかかるって話もしましたけど、たぶん使用例はあるんでしょう。でも、投資に見合うリターンを示すまで、どれくらい時間があると思います?
パリー: 数年くらいじゃないでしょうか。大手テック企業にはそこまでプレッシャーがかかってないと思います。
「持続可能じゃない」って言いたくなる誘惑はありますよ。すごくお金がかかるし、動きが速いし、明らかな使用例もない。でも、これらの企業は何十億ドルもの現金を持ってるんです。今後数年は十分やっていけると思います。
マーク・ザッカーバーグがメタバースにどれだけお金をつぎ込んだか考えてみてください。あれは本当に何にもならなかった。でもMetaは今でも元気ですよ。実際、今年に入ってからのMeta株は、他の大手テック企業を上回るパフォーマンスを見せてます。広告のおかげですけどね。
司会: まだMetaって呼ばれてるんですね。完全に諦めたわけじゃないってことですか。
パリー: そうそう、彼は長期的な視野を持ってるんでしょうね。
この先数年は、かなりの額を使い続けると思います。エンタープライズ市場からの反応を見たいでしょうし...
例えば、先週Googleのクラウドチームの人と話したんですが、企業顧客からのGeminiやAPIへの問い合わせがどれくらいあるか聞いてみたんです。
数字は教えてくれませんでしたが、「とにかくクレイジーなくらい」って言ってました。「去年の倍になった?」って聞いたら、「倍どころじゃない」って。使用率の増加がすごいらしいです。
だから、彼らは今のところ問題ないんです。問題は、企業がこれらのモデルへの支出を続けるかどうかですね。
これはまた別の回でやった方がいいかもしれませんが、投資収益率をどうやって測るかって問題があります。簡単じゃないんですよ。
司会: 全くそうですね。人々も受け入れ始めてるみたいです。AIサービスを買うのは、メールを持つのと同じようなものだと。
ビジネスとして、メールがどれだけお金を生み出してるか測るのは難しいですよね。でも、全従業員からメールを取り上げたら、ビジネスは成り立たなくなる。それくらい不可欠なものになってる。
AIもそうなるんじゃないかって感じがします。ビジネスの生産性を上げる重要な要素になるけど、具体的な数字でその効果を測るのは難しいだろうって。
パリー: でも、ほとんどのメールプログラムは無料ですよね。これは作るのも運用するのもすごくお金がかかるのに。
司会: そうですね。でも、その橋は渡るときに渡ればいいでしょう。
サムとデミスについて、あなたの見解をもう少し聞かせてください。一般の人が知らないけど、知っておくべきことってありますか?
それと、地方のニュースサイトが、自分をAIアバターに変えた人々を使ってニュースを読んだり、地方ニュースプログラムをやったりしてる話についても聞きたいです。
パリー: はい、分かりました。サムとデミスについてですが、二人とも非常にミッション志向の強い人たちだということが分かりました。
性格はかなり違います。サムは率直で、カリスマ性のある人物です。起業家のグルーみたいな存在でした。
彼の最初のスタートアップは、シリコンバレーの基準で言うたら失敗したんですけど、それでも彼は起業家やベンチャーキャピタリストの間で、すごい信頼を得てたんです。起業家のアドバイザーみたいな感じでしたね。
ブログに「スタートアップへの99のアドバイス」みたいなの投稿したりして、すごくコミュニケーション能力が高いんです。他の起業家を助けるのにも積極的で、「メール送ったら、すぐ返事くれて、資金調達の手伝いをしてくれる人を紹介してくれた」っていう話もよく聞きました。
だから、スタートアップの世界で物凄い人脈を作ってたんです。これはOpenAIを始める前、Y Combinatorの代表やってた頃からですね。
一方のデミスは、全然違う性格です。元々チェスの神童で、13歳の時には世界最高クラスのプレイヤーでした。ゲームに夢中だったんです。
「Theme Park」っていうゲーム知ってます? デミスが17歳の時に、ピーター・モリニューと一緒にBullfrog Productionsで共同設計したんです。
その後、若くしてケンブリッジ大学に入って、自分のビデオゲーム会社を立ち上げました。サムの最初のスタートアップと同じように、デミスの最初の会社も失敗しましたが、二人とも失敗から多くを学びました。
そして二人とも、汎用人工知能を作るっていう目標を持つようになったんです。デミスが先でした。2010年頃、科学界ではまだ奇抜な理論だった「人間レベルのAIを作る」っていうアイデアに真っ先に取り組んだんです。
誰も資金を出そうとしなかった。昨日、当時DeepMindに投資しなかったVCの一人と話したんですが、今では本当に後悔してるって。でも当時は、ビジネスモデルがなかったんです。
唯一お金を集められたのは、「未来を売る」シリコンバレーに来てからで、イーロン・マスクやピーター・ティールから資金を調達しました。そしてDeepMindを作ったんです。
デミスって本当に面白い人物なんです。ゲームに取り憑かれてて、しかもゲームがすごく上手い。テーブルサッカーでも、サッカーでも、彼に勝つのは難しいでしょうね。
サムと共通してるのは、すごく競争心が強くて、勝ちたがるところですね。デミスはノーベル賞を取ることにも執着してるって聞きました。彼と働いてた人によると、それが会社の目標の一つだったらしいです。
私の本では、この二人を中心に据えて話を進めました。AIの世界には他にもたくさんの登場人物がいるんですが、AIのガバナンスについて語るには、二人に絞った方が分かりやすいと思ったんです。
司会: 最後にもう一つ話題を。YouTubeであなたのインタビューを見てたら、カメラの前に立ってモノローグを話してるのを見たんです。見てるうちに、「あれ、パリーさんじゃない。AIのパリーさんだ」って気づいて。
これについて話すのにぴったりの人ですね。今週、Wiredで面白い記事を読んだんです。ハワイの「The Garden Island」っていう新聞社で働いてたジャーナリストの話です。
文字ベースのニュースサイトだったんですが、突然ビデオニュースを始めたんです。で、そのニュースのアンカーが誰かというと...実はAIアバターなんです。サイトのニュースを取り上げて、それを読み上げる。まるで普通のニュースみたいに見れるんです。
AIの方向性について考えると...さっき応用の仕方について話しましたけど、事実上ニュースキャスターが...まだ完全に置き換えられたとは言えないですが、AIアバターによって模倣されてるわけです。あなたのビデオのアバターみたいなやつが、実際のニュースを本物の人々に読み上げてる。これについてどう思います?
パリー: 一言で言うと、私たちの未来はとてもノイジーになると思います。膨大な量の情報が、様々な形で押し寄せてくるでしょう。テキストだけじゃなくて、もっとたくさんの動画や画像が生成されるようになる。AIがそれらを大量に作り出すからです。
企業が生成AIをどう使ってるか聞くと、必ず「仕事を奪うんじゃなくて、人間を補強するんです」って言うんです。ちょっと誠実さに欠ける感じがしますけど、評判を守るためにそう言ってるんでしょうね。
でも、ある意味では本当なんです。ニュースキャスターの場合、完全に置き換えてるわけじゃないですよね。ただ、人々がニュースを消費する新しい方法を作り出してるだけです。テキストを読む代わりに動画で見られるようになった。
生成AIによって起こりそうなのは、そういうことだと思います。主要なTVニュースネットワークが近い将来、アンカーをAIに置き換えるとは思えません。でも、小さな地方局とか、今まで動画を作ってなかったような本当に小さなメディアが、動画を作れるようになるかもしれない。
つまり、様々なプラットフォームを通じて、もっともっとたくさんの動画コンテンツが利用可能になるってことです。
司会: すごいですね。Big Technologyでも、技術的にはまだ無理ですけど、もしストロベリーやOpenAIの評価額についてのニュース記事をAIに読ませて、私たちの意見を一文ずつ入れて、あなたの本の内容を加えて「ポッドキャストのエピソードを作って」って言ったら...
クレイジーですよね。私はやりませんけど。AIが生成したモノより、私たちの話の方がずっといいと思います。
でも昨日、自分の体をスキャンして、ウェブサイトの付加機能としてビデオを使ってる編集者と話したんです。驚いたことに、彼はソフトウェア会社に「僕の英語とアクセントは、あなたたちの技術が作り出すものほど上手くないよ」って言ったそうです。
「もっと汚く」...つまり荒っぽくしてほしかったんでしょうね。別に罵詈雑言を入れろって言ったわけじゃないと思いますが(笑)
そうやって調整したら、本人にかなり近い声と見た目になったそうです。それで、各動画が数千回も再生されてるって。
パリー: 数千回も? すごいですね。私には理解できません。人々は本当にこういうのが好きなんでしょうか?
結局こうなると思うんです。あなたが言ったように数千回再生されてるってことは、AIが生成したコンテンツを見る人が増えれば増えるほど、みんなそれに慣れていくんですよ。
ニュースキャスターのAIアバターや、さっきのその紳士のビデオは、最初は少し不気味に見えるかもしれません。でも、そういうコンテンツを長く見てると、だんだん気にならなくなる。
そうすると、TikTokやInstagramのフィードに出てきたり、ウェブサイトで見つけたりしても、普通にクリックするようになる。慣れてるから、大丈夫だって思うようになるんです。
司会: ああ、なるほど...
さて、みなさん。これは本物の私と、希望としては本物のパリーさんとの本当の議論でした。パリーさん、本物ですよね? 生きてる証拠を見せてください。
パリー: (親指を立てる)
司会: そうそう、あなたのアバターはそれができませんからね。
今日は話ができて本当に良かったです。みなさん、ぜひパリーさんの本を手に取ってみてください。「Supremacy: AI、ChatGPT、そして世界を変える競争」です。
「Supremacy」...いいタイトルですね。
パリー: ありがとうございます。
司会: 本の発売、おめでとうございます。お話しできて良かったです。番組に来てくれてありがとうございました。
パリー: こちらこそ、とても楽しかったです。ありがとうございました。
司会: 私も楽しかったです。
みなさん、聞いてくれてありがとうございます。水曜日には、LinkedInのCEO、ライアン・ロスランスキーとのインタビューをお届けします。もちろん、AIについて話します。Microsoftのサブカンパニーですからね。
金曜日には、ロナンと一緒に来週のニュースを分析します。
もう一度、聞いてくれてありがとうございます。また次回、Big Technology Podcastでお会いしましょう。

この記事が気に入ったらサポートをしてみませんか？