ストロベリーQ*がもうすぐ、アップルの人工知能のアップデート、月額2,000ドルのChatGPT、Replitのエージェント(AI最新ニュース)
7,574 文字
おはようさんです。今日の最初のニュースは、OpenAIのストロベリーモデルがもうすぐ登場するっちゅうことですわ。Reutersによると、OpenAIは2週間以内にChatGPTにストロベリーをリリースする予定やそうです。
唯一信頼できるリーカーのJimmy Applesもそのことに言及しとったんですわ。先週、Jimmy Applesは「西部戦線異状なし」言うて、「重たい妄想エネルギーの霧や。また聞いてもらえる準備はできとる」って言うてました。
そして15時間前には「今週、忍耐の洞窟から一歩踏み出すわ」って言うてはりました。彼がまたその洞窟に戻らんでええように願っとります。新しいもんをOpenAIから見たいもんやからね。
3時間前には「忍耐の時代は終わった。リリースの季節や」って言うてはって、もうすぐ来るんちゃうかなって感じですわ。
ちょっと記事を見てみましょか。OpenAIは、推論に焦点を当てた人工知能「ストロベリー」をChatGPTサービスの一部として2週間以内にリリースする予定やそうです。これはThe Informationが火曜日に報じたもんです。
The Informationの記事によると、ストロベリーがChatGPTの一部やけど、単独のオファリングでもあるんです。具体的にどうオファーされるかはまだはっきりしてへんらしいですわ。
一つの選択肢として、ストロベリーがChatGPTを動かすAIモデルの選択肢としてドロップダウンメニューに含まれる可能性があるんですって。普通のサービスとはちょっと違うて、いくつかの利点と短所があるみたいですわ。
ストロベリーを特徴づけとるんは、考える能力、推論する能力、計画を立てる能力、そして時間をかける能力なんです。これが主な違いやねん。プロンプトを入力したときに、実際にもっと推論時間がかかるんですわ。
初期バージョンでは、テキストの入出力しかできへんらしいわ。まだ画像はあかんみたいやね。
そして価格設定についてなんやけど、ストロベリーは無料版と有料版があるOpenAIのチャットボットとは違う価格設定になりそうです。まだ具体的な価格はわかってへんけど、おそらくもっと高くなるんちゃうかなって思います。
ストロベリーは、複雑な質問や複数のステップが必要な質問に対して、現在のGPT-4oよりも使いやすくなる予定やそうです。
すでに使うとった人もおるみたいで、ストロベリーのプロトタイプを使うた人の中には、OpenAIが現在リリースしとるGPT-4oと比べて、ちょっとだけ良い回答が得られるけど、10〜20秒余分に待つ価値はないって不満を言うてる人もおるらしいわ。
ほんでな、95%のプロンプトや使用例はGPT-4o miniでもできるんですわ。GPT-4oすら要らんのです。そんで残りの3〜4%にGPT-4oを使うて、最後の最も複雑な推論が必要な部分にだけストロベリーが必要になるかもしれへんのです。
1週間ほど前に、The Informationは、ストロベリーが主にOrion(OpenAIの次世代フロンティアモデル)の合成データ生成に使われとるって報じとったんやけど、これはちょっと違う話になってきましたな。
でも、どっちにしてもThe Informationによると、OpenAIからすぐに新しいもんが出てくるみたいですわ。もちろん、Jimmy Applesの言うとおりやね。
さて、今週の次の大きなニュースは、昨日のAppleの大きな発表やな。Appleは昨日カンファレンスを開いて、iPhone、Apple Watch、そしてApple Intelligenceについていくつか発表をしたんです。
でもな、新しいiPhone 16 Pro Maxを買うても、1200ドルか1300ドル払うて最新のハードウェアを手に入れても、結局は15や14からの段階的な改良にすぎへんのやけど、それでもApple Intelligenceは最初からは入ってへんのですわ。これはめっちゃ残念やね。
もちろん、私は新しいiPhoneを買うて、ベータ版をインストールして、いろいろ試してみて、みなさんにレビューするつもりやけどね。
ちょっとApple Intelligenceについておさらいしとくと、これは基本的にデバイス上で動く独自のネイティブモデルなんです。でも、ローカルモデルじゃ対応できへん世界知識の質問がある場合は、クラウド上のChatGPTにオフロードするんやけど、その前にユーザーに確認を取るんです。これはOpenAIとの提携やね。
Appleのアプローチ、私はめっちゃ好きやわ。できるだけデバイス上でやって、絶対に必要な場合だけオフロードするっていうのがええと思うんです。実はAppleは、OpenAIのモデルにオフロードする前に、自社のプライベートクラウドにもっと大きなバージョンのモデルを持っとるんですわ。
私は本当に能力の高いSiri、つまり24時間365日タスクを実行し、物事を完了してくれるエージェントやAIを待ち望んでるんです。これが、私が人工知能と対話する未来の完璧なビジョンやねん。
AppleもGoogleも、このビジョンを実現するのに良い位置におるって本当に思うんです。なぜかって、両社とも、実際にユーザーとインターフェースを取るためのハードウェアをユーザーのポケットに入れとるからやね。
iPhone 16のカメラは、Meta AIグラスができることの多くをこなせるようになるんです。何かの写真を撮ると、それが何かを教えてくれるんですわ。
The Informationの記事によると、iPhone 16のカメラには視覚インテリジェンスも含まれるそうで、目の前の風景について情報を調べることができるんです。例えば、目の前にあるレストランのレビューを見つけるとかね。
正直なところ、私はそんなに頻繁には使わへんのです。Meta AIグラスは大好きやけど、視覚AIはそんなに使わへんし、音声AIもそんなに使わへんのです。写真を撮るのにはめっちゃ使うけどね。
でも、これが全部電話に組み込まれたら変わるかもしれへんな。楽しみやね。
次のニュースですわ。Bloombergによると、NVIDIAが司法省から召喚状を受け取って、独占禁止法の調査がエスカレートしとるらしいです。
NVIDIAは人工知能の世界では絶対的な存在で、世界で最も価値のある企業のトップ3に入るんです。基本的に、ファインチューニング、トレーニング、推論に使われるチップの大半を販売しとるんですわ。
そして、CUDAっていう小さなライブラリを持っとるんです。これはNVIDIA独自のもので、基本的にGPUを動かすソフトウェアなんです。おそらく、このCUDAライブラリが問題になっとるんやと思います。
CUDAライブラリがめっちゃ強力で、NVIDIAのエコシステムに深く組み込まれとるから、単にCUDAライブラリのために他社のチップを買う理由を見つけるのが難しいんですわ。
BloombergがこのNVIDIAへの召喚状のことを報じたんやけど、NVIDIAはそんなもん受け取ってへんって否定しとるんです。これはすでに株価にも影響を与えとるんですわ。
Bloombergみたいな大手メディアが報じとるのに、NVIDIAが否定しとるっていうのは面白いですね。今のところ、相反する情報が飛び交っとる状況ですわ。
次は、S-agentのリーダーボード(コーディングAIのリーダーボード)で新しい最高記録を出したモデルの話です。Honeycombっていうモデルが、22.06%のデビンスコアでAmazon Qを抜いて1位になったんです。これはネット上で大きな驚きを呼んだんですわ。ちなみにデビンは13.86%でした。
Honeycombの創業者は19歳のMITの中退者2人で、もちろんY Combinatorに参加しとるんです。この情報を報告しとるのはYCのパートナーのJared Freemanです。
Honeycombはモデルだけやなくて、今すぐ使えるAIプログラマーの完全な製品なんです。
もちろん、ちょっと懐疑的に見ると、Jared Freemanには金銭的な利害関係があるから宣伝しとるんやろうなって思うんですけどね。
Honeycombを見てみると、デビンにめっちゃ似とるんですわ。オープンソースやないのが残念やけど、それでもすごいクールですわ。
次のニュースです。U.AIが5000万ドルを調達して、2025年までに人間よりもAIエージェントの方が多くなると予測しとるんです。これはもう数ヶ月先の話ですわ。
AIを使った検索と生産性向上プラットフォームのu.comが、エンタープライズAIの分野での仕事を続けるために、5000万ドルのシリーズB資金調達を行ったって今日発表したんです。
これはGeorgianが主導して、NVIDIAやSalesforce Venturesみたいな技術大手も参加しとるんです。Day One Venturesも加わって、これまでに約1億ドルを調達しとるんですわ。
私はu.comを使ったことないんやけど、トップページを見るとChatGPTにそっくりなんです。でも、きっと裏側にはもっと多くの機能があるんやろうね。
次はBloombergの記事によると、サム・アルトマンがアメリカで何百億ドルもかけてAIインフラを構築する計画を立てとるらしいんです。これは聞いてて嬉しくなりますわ。
Yahoo Financeの同じトピックの記事によると、OpenAIのCEOのサム・アルトマンは、人工知能に必要な機械やシステムの大規模な構築を計画しとるんです。まずはアメリカで始めて、何百億ドルもかかるらしいですわ。
アルトマンは今年の初めから、この計画に対するアメリカ政府の承認を求めとったんです。この計画は、急速なAI開発を支援するために必要な高価な物理的インフラに資金を提供するための世界的な投資家グループを結成することを目指しとるんですわ。
私たちはすでに、AGI(汎用人工知能)に到達するのに十分なチップも十分なエネルギーもないってわかっとるんです。だから、製造プロセスやチップ製造プロセスにこんな大規模な投資が行われるのは素晴らしいことやと思います。聞いてて嬉しくなりますわ。
カナダ、韓国、日本、UAEの投資家も参加する可能性が高いらしいです。OpenAIはこのプロジェクトに他の民間企業も関わることを想定しとるんですわ。
もちろん、これはアメリカにとっては素晴らしいニュースですね。AGIに到達するために必要なものを全て自国の土地で構築し続けることを願っとります。
次はGroqの話です。彼らは大きな進歩を遂げとるんです。今や彼らはビジョンモデルを持っとるんですが、これはGroqチップで動いとるから、めっちゃ速いんです。
APIコンソールで試せるようになったんですわ。これはLava 1.57Bモデルです。画像をアップロードするだけで、その画像について何でも質問できるんです。しかも、めっちゃ速いんですわ。
ちなみに、私はGroqに投資しとるんで、ちょっと開示しときますね。
Groqからのニュースはまだあるんです。彼らはLlamaモデルでの推論速度を上げたんです。Llama 3.1 70bモデルで、544トークン/秒に達しとるんですわ。これはめっちゃすごいことやね。
このチャンネルをよく見てはる人はわかると思うんやけど、私はAIエージェントが大好きなんです。そして、AIエージェントを作る時に、推論速度はとても重要なんです。
なぜかって、最終的にはそのエージェントが24時間365日、あなたの代わりにタスクを実行できるようになるからです。その推論速度が速ければ速いほど、もっと多くのことをもっと早くこなせるようになるんですわ。
さて、次のニュースはちょっと遅れとるんやけど、Replitが「Replit Agents」を発表したんです。これ、今みんなCursorの代わりに使うとるみたいやね。
Replitって、めっちゃ素晴らしいオンラインコードエディタなんです。今はCursorみたいにAIが組み込まれとるんやけど、クラウド上で何でも構築できて、簡単にデプロイできるんですわ。
ちょっと使い方の例を見てみましょか。ここに短いプロンプトを入れて送信すると、何を構築するかの計画が出てきて、リアルタイムでコードが構築されるんです。めっちゃ速いんですわ。全てのファイルが構築されて、これ全部Replitを通じて簡単にデプロイ・ホスティングできるんです。
実は私、Replitはこれまで数回しか使うたことないんやけど、使う度に素晴らしいって思うんです。ほら見てや、たった2文のプロンプトで、完全に機能するマップアプリケーションができたんですわ。めっちゃ印象的やね。
まだ試したことない人は、ぜひ試してみてください。説明の下にリンク貼っときますね。
次はThe Informationの記事によると、OpenAIが月額2000ドルまでの高額な料金プランを検討しとるらしいんです。
もしAGIを実現したら、私は基本的にいくらでも払う用意があるんやけど、AGIからちょっと離れて考えてみましょか。月2000ドルで、何やったら払ってもええと思う?
もしAIが私の仕事の20%を肩代わりしてくれるんやったら、月2000ドル払ってもええと思うんです。でも、それは一貫性があって信頼できて、高品質でなきゃあかんのやけど、AIモデルはまだそこまでいってへんねんな。でもすぐかもしれへん。
経営陣は、ストロベリーやオリオンって呼ばれる新しいフラッグシップLLMみたいな、これから出る大規模言語モデル向けに高額な料金プランについて議論しとるんです。これらについては前にも詳しく話したことあるんで、まだ見てへん人はそっちの動画もチェックしてみてください。
この料金設定の議論は、ChatGPTのメーカーが年間数十億ドルの赤字を補うために、数十億ドルの資金調達を目指しとる中で行われとるんです。
OpenAIが赤字やから倒産するって思うとる人がおるかもしれへんけど、彼らの技術がいかに革命的かをもう一度考えてみる必要があると思うんです。実際、多くのテクノロジー企業がそうやけど、長い間赤字を出し続けて、それから利益を出し始めると、基本的にお金を刷るようなもんになるんです。少なくともそれが期待されとるわけやね。
ストロベリーやオリオン、そしてAGIのためにいくら払うてもええか、コメント欄に書いてください。
次は、新しいモデルがローンチされましたわ。Find 405bっていうんです。実はこれ先週出たんやけど、まだ話す機会がなかったんです。
Find 405bは明らかにLlama 3.1 405bのファインチューンですわ。Human Evalで92%のスコアを出して、Claude 3.5 Sonnetに匹敵するんです。
Reflection 70bの論争があったんで、これらのリリースはちょっと懐疑的に見とるんやけど、Findはこれまでもモデルをリリースしてきて、実際にええモデルを出しとるんです。全部合法的みたいやね。
「新しいフラッグシップモデルFind 405bと、プログラミングや好奇心旺盛な質問に超高速で答えるFind Instantモデルを紹介します。優れたMeta Llama 3.1 405bをベースにした新しいフラッグシップモデルFind 405bのローンチを発表できて嬉しいです。
プログラミングや技術的なタスクに最先端のモデルになるように訓練しました。128kトークンのコンテキストを処理でき、ローンチ時に32kのコンテキストウィンドウが利用可能です。今すぐFind Proユーザーが利用できます」ってことやね。つまり、有料なんですわ。
次は、OpenAIの社内文化の変化が実際に定着しとるみたいやね。
Jason Quan(OpenAIのCSO)がカリフォルニア州法案1047についての投稿で、「先週金曜日に同僚に言うたこと」を紹介しとるんです。
「みんな、こんにちは。AIラボの従業員の間で、CA 1047法案への支持を表明するオプションがある請願書が回っとるって聞きました。請願書に署名したいなら自由にしてええって知ってほしいんです。
OpenAIがうまくいっとる理由の一つは、会社の立場に関係なく、個人的な見解の多様性があることなんです」って。
ようやくOpenAIの従業員が自分の意見を表明したり、声を上げたりすることを認めるようになったんやね。これはええことやと思います。
カリフォルニア州法案1047について知っとる?私もちょっと調べてみたんやけど、みなさんはどう思います?コメント欄で教えてください。
次はSambaNova Systemsが世界最速のAIプラットフォームをリリースしたんです。
Sora Cloudは、Llama 3.1 405bを完全精度で132トークン/秒で実行できるんです。これめっちゃ速いですわ。Llama 3.1 70bを570トークン/秒で実行できるのは、Groqと同等やね。
残念ながら、今のところGroqは405bをサポートしてへんのです。一時的にサポートしとったんやけど、人気が高すぎて過負荷になって、取り下げなあかんかったんです。でもすぐにまた出すと思いますわ。
SambaNova、GPUより10倍速い推論ができるんです。SovaCloudを使うて、めっちゃ速い速度を体験できますわ。ローンチおめでとうございます。
最後のニュースです。Deep Seekっていう会社が新しいモデルをリリースしたんやけど、これがコーディングと数学が抜群にできるんです。
ここにDeep Seek v2.5オープンソースがあるんやけど、見てのとおり、推論、数学、算術、知識、コーディングのほぼ全てのカテゴリーで他のモデルを上回っとるんです。
全部テストしてみた方がええかもしれへんな。見たい人はコメント欄で教えてください。
コストを見てください。100万トークンあたり、入力が14セント、出力が28セントです。これめっちゃ安いんですわ。
自分でホスティングしたい場合は、オープンソースやからダウンロードできます。Deep Seekのリリース、おめでとうございます。
今日はこれで以上です。この動画が面白かったら、ぜひいいねとチャンネル登録をお願いします。次回の動画でまたお会いしましょう。
この記事が気に入ったらサポートをしてみませんか?