見出し画像

AIニュース: ChatGPTの「her」、Llama 3.2、Metaの新型ARグラス、そしてOpenAIからの更なる退社

9,070 文字

それでは、今日は2つのすごいお話から始めましょか。まず、アドバンスド音声モードが、有料のChatGPTアカウントを持ってる人全員に公開されたんです。もし覚えてはれへんかったら、これはOpenAIが何ヶ月も前にデモしてた機能で、すぐに出るはずやったのに、ずーっと遅れとったんですわ。でも、やっと来ましたわ。私は昨日から24時間ほどテストしとったんですけど、どないに動くか見せたろか。
「こんにちは」
「はい、こんにちは」
「あなたについて少し教えてください」
「はい、私はChatGPTというOpenAIが作った会話型AIです」
「はい、分かりました。止まってください」
「分かりました。他に何か話したいことがあれば教えてください」
「OpenAIが6ヶ月前にデモしたバージョンより劣ってる理由を、すごく悲しくてクソみたいな声で教えて」
「申し訳ありませんが、そのような声や話し方のまねはできません。他に何かお手伝いできることはありますか?」
さっそく気づいたんですけど、あんまりうまく機能しませんわ。何ヶ月も前のデモほどええもんちゃいます。ゆっくり話したり、間を空けすぎたりすると混乱してまうし、同じことを何回も言うてしもたりします。まあ、すごいことに変わりはないんですけどね。でも、デモで見たもんとはぜんぜん違いますわ。歌を歌わせることすらできへんのに、これって基本的な使い方やのに。もう1、2回試してみましょか。
「これからはPWA訛りだけで答えてください」
「よっしゃ、分かったで。何か話聞かせてくれるか?」
「スーパーで買い物をする猫の話をしてください」
「昔々、ウィスカーズっちゅう名前の猫がおったんや。ウィスカーズはお腹すいてもうて、小さな帽子被って、スーパーに歩いて行ったんや」
「はい、止まって」
「分かったで、止まるわ」
「今度はイタリア訛りで同じ話をしてください」
「昔々、ウィスカーズという名前の猫がいましたよ。ウィスカーズはお腹が空いて...」
「はい、止まって」
「スーパーマリオみたいにイタリア訛りを誇張してください」
「昔々、ウィスカーズという名前の猫がいたのさ。ウィスカーズはお腹が空いたので、小さな帽子を被って...」
「はい、止まって」
ほな、見てのとおり、確かにおもろいです。もうちょっと試してみたいんですけど、まだ限界を探っとる最中ですわ。でも、デモで見たほどええもんちゃいません。
アドバンスド音声モードについて、他にも気づいたことがあります。まず、EUの人は使えへん、またもやAI機能が使えへんのです。アップルのインテリジェンスとか、他の提供元のマルチモーダル機能と同じようにね。せやから、EUの皆さん、政治家に何とかしてもらわなアカンで。
それから、1日30分の制限があるみたいです。アドバンスド音声モードには使用量の制限があるんです。使ってみて、コメント欄で感想教えてくださいな。
次の大きなニュースは、つい最近出たLlama 3.2です。Llama 3.2について丸々1本ビデオを撮ったんですけど、ハイライトを言うとこうです。新しく2つのモデルが出ます。110億パラメータと900億パラメータのバージョンで、ビジョン機能が組み込まれとるんです。これらはモデルにネイティブなビジョン機能で、Llama 3.1の代替になります。テキスト推論能力を犠牲にせずに、そのまま使えるようになっとるんです。
それに、新しく10億と30億パラメータのバージョンも出ました。これらはめっちゃええ性能で、デバイス上で動くように作られとるんです。つまり、エッジやスマホ、パソコンなんかで動くってことですわ。めっちゃええ感じですわ。性能もええし、ビジョン機能もすばらしい。もっと詳しいビデオをすぐに出しますわ。
次はMetaがARグラスを出しました。これは完全にスタンドアローンのARグラスで、AIも搭載しとるんです。Orionっていう名前で、見た目は分厚いレイバンみたいな感じですけど、レイバンのブランドは付いてへん。でも、めっちゃ技術が詰まっとって、すごいんです。
アップルのVision Proについては、もう何回も話しましたけど、アップルはより軽くて安いグラスに注力するために、Vision Proの開発をほぼ止めたらしいです。私はその approach、いやアプローチがええと思います。それに、AIとのインタラクションにグラスを使うことについても何度も話してきました。少なくとも私は、1日中グラスをかけとくのは嫌やなって。
ほな、ブログ記事を見てみましょか。「真のAR グラス、Orionの紹介」。ちょうど先週、スナップチャットがARグラスを発表したばっかりなのに、今度はMetaが出してきたんです。正直、Metaのほうが見た目ええと思いますわ。
ちょっと読んでみましょか。「5年前、私たちはARグラスを作ると世界に宣言しました。指先で世界中の情報にアクセスできることと、目の前の現実世界に存在することを、人々が選択を迫られるべきではないと私たちは考えています。そこで今日、Orionを発表します」
ほな、これがOrionです。見た目はこんな感じで、ほんまにレイバンみたいですけど、全体的に分厚くなっとるんです。
これで何ができるか見てみましょか。このビデオでは、現実の環境に映像を投影しとるんです。アップルのVision Proと似たようなことができるんですけど、もっと小さな形でね。
このビデオを見ると分かりますけど、世界のトラッキングは$3,500のアップルVision Proほどええわけやないです。Vision Proはめっちゃええ性能なんですけど、Metaはその技術を小さくして、もっと小さな形に詰め込まなあかんかったんです。やから、そこまでええわけやないですけど、でもあの大きくて重いゴーグルをかける必要もないんです。
これらのグラスには、色補正、電力、明るさに最適化されたマイクロLEDプロジェクターと、光学グレードのシリコンカーバイドが使われとって、70度の視野角を実現しとるんです。カスタムシリコンも入っとって、カスタムチップのおかげで、ヘッドセットやスマホの何分の一かの電力と重さで、ダイナミックなAIとAR体験ができるんです。
マグネシウムフレームは、極端な熱と重量分散を管理しながら、快適さを最大限に高めとるんです。そして、小型化されたカメラとセンサーが、高度な手と世界のトラッキングを可能にしながら、AIにリッチな洞察を提供しとるんです。
前面と側面に複数のカメラがあるのが見えますね。それに、リストバンドみたいなものも付いてくるみたいです。革新的な筋電図技術を使ったリストバンドで、目立たずに社会的に受け入れられる入力ができるんです。暗い場所や人前でも、手を見えるところに出さんでも使えるんです。
EMGリストバンドの詳細も見てみましょか。内側にたくさんのセンサーが付いとるのが分かりますね。見た目はええと思います。普通のリストバンドやスマートウォッチと変わらへん感じです。
それから、めっちゃ小さな計算デバイスもあります。全ての計算をグラスに詰め込むことはできへんかったんですけど、ワイヤレスの計算デバイスがあって、これをポケットに入れるんです。
「ポケットサイズのコンピューティングの自由を体験してください。あなたの条件で現実を強化するように設計されたOrionは、コンパクトなワイヤレス形状で低遅延の計算能力を提供します」
つまり、グラスと、ポケットに入れるもの、そしてリストに巻くものがあって、これらを全部合わせると、めっちゃすごいデバイスになるんです。絶対買って試してみて、感想をお伝えしますわ。
今はまだプロトタイプだけなんです。AIの世界ではよくあることですわ。何かを見せて、「プロトタイプです」って言って、「十分よくなったら発売します」みたいな。私はあんまり好きやないんですけど、まあ、早く見られるほうがええかもしれませんね。
今日から、Metaの従業員と選ばれた外部の人たちに、Orionの製品プロトタイプへのアクセスを開放するそうです。開発チームが学び、改良して、消費者向けARグラス製品ラインに向けて構築できるようにするためです。Meta、私にも1つ送ってください。試してみたいです。
これから先、彼らが注力するのはこんなことです。AR表示の質を調整して、視覚をさらに鮮明にすること。できるだけ形状を小さくすること。そして、大規模に作って手頃な価格にすること。
私が推測するに、これが最終的に発売されるときは1,000ドル以上すると思います。こんなに小さな形に詰め込むには、たくさんの技術が必要ですからね。
次は、アップルの多くの製品デザインで有名なジョニー・アイブが、OpenAIのサム・アルトマンと協力して、AIハードウェアデバイスを作っとるんです。彼自身が確認しました。
ご存知ない人のために言うと、ジョニー・アイブはアップルを辞めた後、「LoveFrom」っていう新しいデザイン会社を立ち上げました。彼らの最初の製品は、モンクレールっていう服のブランドとのコラボで、3,000ドルのジャケットなんです。革新的なところはボタンだけ。ただのボタンです。
これは私の予算範囲外ですし、正直言って、見た目もええとは思えへんです。ここにいくつかのバリエーションがあって、これらがボタンです。
でも今は、OpenAIと協力して、AIデバイスの未来を作っとるんです。どんなものになるか、めっちゃ楽しみです。
次に、The Informationによると、Claudeを作ったAnthropicが、資金調達の話し合いで400億ドルの評価額を出したそうです。
主要なAI企業は今、みんな資金調達をしとるんです。OpenAIの最大のスタートアップ競合相手であるAnthropicは、投資家と資本調達の話を始めました。この取引で、スタートアップの評価額が300億から400億ドルになる可能性があるんです。これは、今年初めに締結した資金調達での評価額のほぼ2倍です。
Claudeはめっちゃ優秀なモデルですけど、今週のアドバンスド音声モードと01の発表を見ると、OpenAIが一歩リードしとるように見えますね。
年初め頃、Anthropicは今年の終わりまでに、年間収益が約8億ドル、つまり1ヶ月あたり6,600万ドルの収益を生み出すと予測しとったんです。これはめっちゃ大きな額ですわ。
AmazonがClaudeを顧客に再販売しとって、多分それが収益の大部分を占めとると思います。でも、会社は27億ドルの赤字も予測しとるんです。OpenAIも同じで、これらの会社はめっちゃ速く動いて、めっちゃ投資してるから、そう、赤字を出してるんです。でも、テクノロジーのスタートアップは何十年もこれをやってきて、いつかは利益が出るようになる。
次は、MicrosoftのAI部門で人事異動がありました。MicrosoftのAI部門は今、元InflectionのCEOであり創業者のMustafa Sulimanがヘッドをしとるんです。普通、こんな人事異動だけやったらニュースにはならへんのですけど、The Informationによると、これは彼らの今後の戦略、特に合成データに関する戦略を示唆しとるそうです。
ちょっとこの記事のポイントを見てみましょか。Microsoftは合成データを使ってfiを作りました。InflectionのCEOやったMustafa SulimanをMicrosoft AIのCEOとして雇いました。そして1月には、fiの主任研究者やったSebastian BubeckをMicrosoft Researchから、蒸留モデルの構築に焦点を当てた新しい組織に移しました。でも今、Mustafa Sulimanが責任者になったんで、Bubeckは研究部門に戻ることになりました。つまり、次世代のフロンティアモデルのトレーニングに合成データを使うことから、少し距離を置くことになるかもしれませんね。
次は、Stability AIの話題です。「アバター」や「ターミネーター」、「タイタニック」なんかの映画で有名な監督のジェームズ・キャメロンが、Stability AIの取締役会に加わりました。
Stability AIは言うとります。「キャメロンの参加は、我々のビジュアルメディアを変革するというミッションにとって、大きな一歩前進を意味します。彼のアートを中心とした視点と、ビジネスや技術の知識は、我々がクリエイターのために、かつては想像もできなかった方法で物語を語る新しい機会を解き放つ、フルスタックのAIパイプラインを構築し続ける上で、かけがえのないものになるでしょう」
ハリウッドとAI企業がどんどん近づいてきとるみたいですね。先週は映画制作会社のLionsgateがRunwayと提携しましたし、今回はこのニュースです。少なくとも、先見の明のある映画制作会社や映画プロデューサー、映画監督は、音楽業界がMP3に対して長い間戦ったみたいに戦うんじゃなくて、クリエイティブなプロセスにAIをどう組み込むかを考えとるんやと思います。
次は、Boston Dynamicsからのアップデートです。彼らのSpotとAtlasロボットがアップグレードされました。ここで超音波検査をしとるのが見えますね。そして今は自律的なレーザースキャンができるようになりました。つまり、見知らぬ環境をナビゲートするのがもっと上手くなったってことです。
ここでは、現実の環境をマッピングしとるのが見えます。めっちゃかっこええですね。そして、Spotはもう1つのドッキングステーションに限定されへんようになりました。複数のドッキングステーションを環境内のあちこちに配置して、必要なところで充電できるんです。
複雑な環境をナビゲートするのも、今までで一番上手くなりました。ここで見えるように、はしごの下をくぐるんじゃなくて、周りを回っとります。明らかにSpotは不吉なことを信じとるんですね。難しい階段も上がれます。
Boston Dynamicsのすごさがよくわかりますね。彼らの人型ロボットの将来のバージョンが楽しみです。
次は、昨日Google DeepMindが2つの新しいモデルをリリースしました。「今日、我々は2つの更新された本番用Geminiモデルをリリースします。Gemini 1.5 Pro 02とGemini 1.5 Flash 02です。1.5 Proの価格が50%以上削減されました。これは入力トークンと出力トークンの両方に適用されます。1.5 Flashのレート制限が2倍に、1.5 Proは3倍になりました。出力速度が2倍になり、レイテンシが3分の1になりました」
このニュースは全部素晴らしいんですけど、ここ2週間で他の会社が発表したことと比べると、インパクトはそこまでないかもしれませんね。でも、まあ、Googleもがんばっとるってことですわ。
次に、OpenAIが白亮に、エネルギー生産での協力を提案したらしいです。ホワイトハウスでの会議で、OpenAIのサム・アルトマンが、最大5ギガワットのデータセンターを建設することの利点について、会社のレポートを共有しました。そんな施設があれば、およそ300万世帯分の消費量に相当するんです。
将来的には、おそらくミニ原子力発電所で動く巨大なデータセンターがたくさんできるんでしょうね。それってめっちゃクールな未来やと思いませんか? もし、こういう独立した分散型のデータセンターとエネルギー生産施設がたくさんできたら、AIがもっと安全になると思います。
次も、The Informationからのお話です。OpenAIがSoraをリニューアルしとるらしいです。Soraって覚えてますか? OpenAIが発表したけど、結局リリースせんかったテキストから動画を作る製品です。めっちゃすごそうやったんですけど、結局使えへんかったんです。間違いなく、私が見た中で一番ええテキストから動画への変換製品やったんですけど、最初の発表以来、同じくらいええものをいくつか見ました。
でも今、OpenAIがバージョン2を作っとるらしいんです。でも、バージョン1はどこにあるんでしょうね? 使いたいんですけど。
ステファニー・パラゾロによると、「当時、多くの投資家が私に言うてました。印象的なSoraのデモが、競合するAIビデオスタートアップの群れに不吉な影を落としとるって。でも、OpenAIはまだSoraをリリースしてへんのです。」
でも、それも変わるかもしれません。OpenAIの幹部と話をした人によると、OpenAIは新しいバージョンのSoraをトレーニングしとるそうです。今年の初めにデモしたものよりも、高品質で長い動画をすぐに生成できることを望んでいるそうです。つまり、もうすぐ何かしらのSoraを使えるようになるかもしれませんね。
次は、NotionがAI統合を深くその製品に組み込んでリリースします。私は毎日Notionを使っとるんです。ちょっと重たいときもありますけど、だいたい気に入っとります。そして今、たくさんの新しいAI機能が追加されます。
今日Notionを開いたら、すぐにこの新機能について案内されました。まだ使ってみてへんのですけど、どんなことができるか見てみましょか。
外部システムもスキャンできるみたいです。これはちょっと特殊ですね。だってNotionって、それ自体がデータのソースやのに。もちろん、文章を生成するのもできます。これは別に新しくはないですね。PDFや画像を分析するのもできます。これはかっこええですけど、またまた新しくはないです。
これらの機能のほとんどは基本的なものですけど、Notionにネイティブで組み込まれたのはええことやと思います。AIに対してかなり保守的なアプローチを取っとるみたいですけど、何もないよりはましですわ。
次は、AI2から新しいモデルファミリーが発表されました。Muloって言うんです。最先端のマルチモーダルAIモデルのオープンな家族です。彼らの最高のモデルは、1000分の1のデータで、独自システムのパフォーマンスを上回るそうです。
Allen AI.orgで自分で試すことができます。ここに学術ベンチマークとヒューマンプリファレンスELOレーティングのスコアがあります。ここがMuloシリーズのモデルで、ここがGPT-4です。
Mulo 72bはGPT-4を上回っとります。私自身でテストせなあかんですね。このMuloモデルの完全なテストのビデオを作ってほしいかどうか、教えてください。
学術ベンチマークでは、ほぼ全てのカテゴリーで他のモデルを上回っとります。ヒューマンプリファレンスELOレーティングでは、Mulo 72bは、通常、新しいモデルをベンチマークするのに一番ええ方法なんですけど、唯一負けとるのはGPT-4だけです。でも、わずか2ポイント差ですわ。他のモデルは全部勝っとります。
ええところは、オープンソースやってことです。今日からダウンロードできます。
ここに、Apple Vision Proに組み込んでリアルタイムで使えるデモがあります。めっちゃかっこええデモですわ。ちょっと見てみましょか。
歩き回りながら、「この機械は何に使うんですか?」って聞いてます。写真を撮って、Muloに送って、それからMuloが音声で答えを返すんです。ちょっと聞いてみましょか。
「はい、基本的なことから始めましょう。ねえMulo、この機械は何に使うの?」
「これは洗練されたコーヒーステーションです。デジタルディスプレイ付きの大きなステンレス製マシンがあり、周りにコーヒーカップ、クリーマー、砂糖の小袋が置かれています」
これはめっちゃかっこええデモですね。このコーヒーメーカーのさまざまなオプションの概要を聞いとるんです。そして、説明しながらリアルタイムでハイライトしとります。ちょっと見てみましょか。
「これらのオプションの概要を教えて」
「画像にはさまざまな飲み物のオプションがあるコーヒーマシンが写っています。コーヒーはさまざまな濃さで利用可能で、強めのコーヒーを好む人のための「コーヒー強さx2」オプションもあります。ミルクベースの飲み物を好む人には、カプチーノやラテなどの特別なメニューがあります。カフェモカやバニララテなどのフレーバー付きの特別メニューも提供されています」
めっちゃかっこええですね。
そして、AIニュースのビデオ撮影が終わったと思った矢先に、また新しいニュースが飛び込んできました。ミーラ・モラディが、このビデオを録画してから3分前に、OpenAIのチームに次のようなメモを共有したんです。
「今日、皆さんと共有したいことがあります。多くの熟考の末、OpenAIを去るという難しい決断をしました。OpenAIチームでの6年半は、非常に特別な経験でした。今後多くの人々に感謝の意を表しますが、まずはサムとグレッグに、技術組織をリードする信頼を寄せてくれたことに感謝したいと思います」
それから、いろんな理由とかを書いとるんですけど、本当の理由はこれです。
「私が去るのは、自分の探求をするための時間と空間を作りたいからです。私の主な焦点は、私たちが築いてきた勢いを維持し、スムーズな移行を確実にするために、私のできる全てを尽くすことです」
またひとり去っていきましたね。1年前のサム・アルトマンが解雇された時の騒動を覚えとる人もおるかもしれませんが、ミーラ・モラディが一時的に引き継いだんですよ。たぶん、あの時のクーデターの一員やったんでしょうね。
まあ、今は出ていくことになりました。イリヤはもういませんし、ミーラも行きました。グレッグ・ブロックマンは長期休暇中で、サム・アルトマンだけが残っとるんです。でも、めっちゃ速いペースで製品を出し続けとりますね。
今日はこれで終わりです。これらのニュースやこのビデオを楽しんでもらえたら、いいねとチャンネル登録をお願いします。次の動画でまたお会いしましょう。

この記事が気に入ったらサポートをしてみませんか?