AIニュース: OpenAIが新たな何かを企てている

2024年7月10日 20:49

OpenAIとサム・アルトマンが何かを企てています。活発な動きがありますが、何が起こっているのか100%確信が持てません。しかし、何が起こっているかを見てみましょう。さらなるAIコンテンツを得るためにチャンネル登録をお願いします。
OpenAIはこれまで比較的静かでした。ChatGPTの音声モードなど、まだ展開されていないものもいくつか発表していましたが、今日、なぜ彼らが比較的静かだったのか、そしてなぜそれが変わろうとしているのかがわかりました。
まず第一に、中国の開発者たちがOpenAIのアクセスをブロックするのに躍起になっています。OpenAIの開発者で、APIを使って様々なプロジェクトを行い、それらのプロジェクトへのアクセスを世界中に提供している場合、OpenAIから一部の国々へのアクセスを制限するというメールを受け取ったかもしれません。これは完全に予期せぬことではありませんし、全く新しいことでもありません。
OpenAIは先月、中国を拠点とするAI開発者の取り締まり計画を発表しました。デフォルトでは中国からOpenAIにアクセスすることはできません。ファイアウォールがありますが、多くの中国のAI開発者はそれを回避しています。これらの開発者は、予想通り、仮想プライベートネットワーク（VPN）を使用してファイアウォールを回避する巧妙な方法を考え出しました。
中国のAI研究者の中には、この動きが中国のAIコミュニティに大きな懸念を引き起こしたと言う人もいます。彼らは、この決定が世界的なAI技術への公平なアクセスに関する疑問を提起すると言っています。私の皮肉な見方では、彼らが「公平」という言葉を使うのは、西側の記者に話すときだけなのではないかと思います。つまり、それは話題になることなのか、それとも西側世界向けのPRのようなものなのか、本当に興味があります。中国のAI研究論文を読むと、ローカライゼーションと呼ぶべきものに非常に長けているからです。彼らが発表するある種のものは、単に言葉通りに翻訳されるだけでなく、その国や人口に訴えかけるように変更されるのです。
噂の製造所は大忙しです。多くの人々が、これはOpenAIが別の大きなリリースの準備をしているのかと尋ねています。GPT-5か、あるいは何らかのAPIアップデートを投入するのではないかと考えています。他の変更もあるようです。昨日追加されたEU APIのOpenのような新しいドメインがあるようです。TBERは「世界の残りの部分が新しいモデルやAPIアップデートをすぐに受け取るように聞こえる」と言っています。これについては後で戻ってきましょう。なぜなら、OpenAIが新しい製品や新しいモデルをどのようにリリースしようとしているかについて、手がかりがあるかもしれないからです。それに関する新しいデータがありますが、少し後で戻ってきましょう。
アリアナ・ハフィントンという人物をほとんどの人が聞いたことがあると思います。彼女はハフィントン・ポストの共同創設者であり、より重要なのは、私たちが話している内容に関連して、Thrive Globalのチーフエグゼクティブオフィサーです。彼女は、サム・アルトマンとの共著で、タイム誌に掲載された「AIによる行動変容が医療を変革する」という記事に言及しています。彼らは、私たちが直面している健康の問題、医療費の問題、慢性疾患などについて語っていますが、行動変容は奇跡の薬になりうると言っています。疾病予防と治療の最適化の両方において。これは真実です。睡眠の最適化、栄養、運動など、病院に行ったり医者を訪れたりする必要なく、できることはたくさんあります。
しかし、行動変容は難しいものです。しかし、超個別化を通じて、AIがユニークな立場でこれを解決できると彼らは言っています。アイデアは、AIの大規模言語モデル、つまりChatGPTのようなものを使用することです。これはあなたについて、あなたの習慣について、おそらくあなたの医療ファイルについて、あなたが達成しようとしていることについて多くを知っており、それを達成する方法をコーチすることができます。
これらのアイデアは、Thrive AI Healthの背後にあるものです。OpenAIのスタートアップファンドとThrive Globalが共同で資金を提供し、カスタマイズされた超個別化されたAIヘルスコーチを構築します。これはモバイルアプリとして利用可能になり、また企業向けの側面もあるようです。
私にはこれが機能すると見えます。本当によく機能すると思います。カロリーやマクロ栄養素プロファイルなどを追跡している人は、より良く食べる傾向があります。自分が食べているものと、それがどれだけのカロリーを持ち、日々のマクロ許容量の中でどのように適合するかを意識するだけで、それ自体があなたが食べるものと選択するものについてより賢くなります。
別の研究では、ホテルのハウスキーパーや清掃クルーの一部を対象に、清掃活動が減量や健康増進にどれだけ良いか、1日にどれだけのカロリーを燃焼するかなどを説明しました。その結果、その人たちはより多く動き、より多くのカロリーを燃焼し始めました。なぜなら、それがより意図的になったからです。
彼らが言うように、リアルタイムの励ましや推奨を提供する誰かがいるだけで、健康に向けて小さな行動や小さなステップを必要とする人にとって、本当に大きな違いをもたらすと思います。
私は自分の音声AIアシスタントを作ることを試みてきました。それらは様々な言語モデルを使用しています。CLA 3.5やGPT-4.0などです。このチャンネルでそれらを紹介してきましたが、常に思うのは、特定のシナリオでそれを使用できたらいいなということです。
例えば、ワークアウトをしているとき、何セット行ったか、特定の運動で何回反復したか、使用した重量などを記録できるものがあれば良いでしょう。次回のワークアウト時に「前回は何をしたっけ？」と尋ねることができます。現在は、そのために数字を入力してトラッキングするアプリを使用するか、ペンと紙を使用するかのどちらかですが、両方の場合で運動から離れてしまいます。運動の終わりに全ての反復回数と重量を覚えていられないかもしれないので、止まって書き留めなければなりません。
同じことが、AIビジョンを使用して食べているもののスナップショットを撮り、自動的にカロリー、タンパク質、炭水化物、脂肪などとしてトラッキングされる場合にも言えます。100%正確である必要はありません。毎日の食事の大まかな見積もりを、摩擦なく、フラストレーションなく、簡単に自分のパーソナルアプリにトラッキングし、後で使用できるようにするだけでいいのです。例えば、「先週の朝はずっと気分が良かった。何を食べていたんだろう？」と言えば、そのデータを参照して推奨を提供することができます。
OpenAIが行っていることで興味深いのは、現在、彼らが比較的静かで大きな新リリースがないように見えるが、同時に彼らが広範囲にわたって行っているすべてのことについて、多くの噂やささやきがあることです。例えば、ここでは彼らはヘルス系のスタートアップと提携しています。多くの人々が、彼らがSoraのようなものを使って映画を開発し始めるために、ハリウッドのスタジオの多くと話をしていると言及しています。
一方で、GPT-4.0に近づいたり、それを上回ったりする様々な他の企業についてほぼ毎日ニュースを聞いています。例えば、中国のAI企業SenseTimeが、SenseNova 5.5でリードを取っています。報告によると、主要な指標でGPT-4.0を上回ったとのことです。
ここでJR KBは言っています。「彼らは最近著しく成長した唯一の企業なので、次のモデルをリリースする前に時間をかけることを恐れなくなった。一般の人々はベンチマークを認識しておらず、ベンチマークを認識し、誰がエリートかを知っている私たちでさえ、私は言わなければなりません。つまり、私はある程度ベンチマークを軽視しています。確かに、それらを見て、何かが支配的であれば、それは私にとって興味深いです。そのモデルがどれほど優れているかを理解しようとさらに調べますが、額面通りには受け取りません。」
しかし、これらすべての要点は、このチャートです。これは世界中のデスクトップとモバイルウェブの訪問数です。この青い線、それはChatGPTです。30億回の訪問に近づいており、このロケットのような成長、これは2024年4月頃でした。これが引き起こされた理由を推測できますか？なぜしばらくの間横ばいだったのに、このように急上昇したのでしょうか？
ちなみに、これらは他のモデルです。ここにオレンジ色でGoogleのGeminiがあります。Character AIは非常に興味深い会社で、様々な理由で少し狂っています。創設者が誰なのかだけでなく、どれだけ多くの訪問を得ているか、そして人々がそれを何に使用しているかも含めて。それについては別の動画で見てみましょう。そして下にはPerplexity AIとClau AIがあります。
私にとって、このチャートを見るのは非常に奇妙です。なぜなら、これは私にとって非常に驚くべきことだからです。毎日これらのことに深く関わっているので、私はChatGPTとClau AIが互角だと思っています。なぜなら、それが人々が話していることだからです。しかし、現実は、大多数の人々はおそらくGoogleのAIモデルの名前を言えないでしょう。それがGeminiだとは言わないでしょう。ほとんどの人はPerplexity AIが何なのか全く知りません。みんなGoogleを知っています。人々はBingを知っています。誰もPerplexity AIを知りません。人々はChatGPTを知っています。Clau AIについてはそれほど知りません。それはChatGPTについて少なくとも聞いたことがある人々の数のごくわずかな割合です。
これが私に示しているのは、注意して受け取ってください。私はこれを事実として知っているわけではありませんが、OpenAIは世界をリードするAIモデルとしての立場にとても快適に感じているように見えます。また、次の最高のものをリリースするたびに何が起こるかに注目してください。非常に迅速に、10の異なるコピーキャットが現れ、それに近づこうとし、成功しています。
Soraの発表は衝撃的でした。皆、心を奪われました。しかし今、私たちはSing AI、Runway Gen 3、Luma AIによるリリースを受けています。そして私は言わなければなりません。それらはすべて本当に良く見えます。それらがSoraと同じくらい優れているかどうかはわかりません。Soraから見た例が、最高のものから選ばれたものなのか、それとも平均的な出力なのかはわかりません。しかし、通常、OpenAIが何かをリリースすると、6ヶ月以内に他の多くの企業が追いつき、同じくらい優れたものか、ほぼ同じくらい優れたものを作るように見えます。
推測するなら、OpenAIはおそらく、次の大きなものを一度にあらゆる場所に展開するための基盤を築いていると思います。彼らが持っている次の大きなものがリリースされるたびに、そのヘルスアプリ、コーチの基盤を持ちたいと思っています。ハリウッドのスタジオとのいくつかの契約を結びたいと思っています。彼らのAPIをあらゆる場所に配置したいと思っています。中国のような、表示したくない場所には表示されないようにしたいと思っています。なぜなら、AI戦線で起こっている米中の対立のようなものが潜在的に問題を引き起こす可能性があるからです。
次の大きなものが展開されると、すでにユーザー、アプリケーション、あらゆるものと1日目からつながっている状態にしたいのです。なぜなら、一般に公開された瞬間から、他の誰もがOpenAIモデルの出力をトレーニングデータとして使用し、類似のものやより優れたものを作成できるようになるからです。ここでの目標は、すべてが接続された既存のインフラストラクチャにリリースすることだと思います。
もしこの急激な成長の理由を疑問に思っているなら、これは音声エンジンを発表した頃でしたが、まだ音声エンジンは手に入れていません。この成長は、ChatGPT 4.0に無料でアクセスできるようになったことだと思います。ログインせずに、アカウントを作成せずに、無料プランでアクセスできます。シークレットウィンドウを開くと、ログインせずに、サインインせずに、アカウントを作成せずにChatGPTを使用できます。無料プランで世界最高のモデルであるGPT-4への限定アクセスが得られるのです。
これは私にとって、嵐の前の静けさのように感じます。彼らがすべてを無料で提供しているのは、より大きなものが来ないからだとは思いません。第一に、準備中の本当に大きな何かがあると思います。第二に、彼らは消費者向けの販売にそれほど焦点を当てないと思います。つまり、月額19ドルのChatGPTサブスクリプションは彼らの主な焦点ではありません。彼らは企業ビジネス、ハリウッド、これらのAIヘルス企業に販売したいと思っています。エンドユーザー向けのアプリを作ることができるように、あるいはAppleなどの企業側に販売することができるように。それが大きな発表でした。iPhoneと統合されるということです。
そして私はそれが彼らの計画だと思います。彼らはAppleやハリウッド、そしてすべての場所に接続されたいと思っています。そうすれば、次の大きなモデルを展開するときに、それが更新され、一度にすべてのデバイスとすべての場所で稼働することになります。
ここにノーム・ブラウンがいます。彼はOpenAIで推論の研究をしています。彼は最初の超人的ノーリミットポーカーAIを共同で作成し、Ciceroも共同で作成しました。私たちはこのチャンネルでCiceroについて少し話しました。
リスクのようなゲームを想像してください。世界を征服することになっていますが、もっと多くの外交があり、他のプレイヤーと交渉したり、同盟を結んだり、それらの同盟を破ったり、基本的に協力して生き残るか世界を征服しようとする非常に戦略的なゲームです。非常に社会的なゲームで、相手が何を考えているかを理解する必要があります。彼らは本当にあなたの相手ではありません。彼らはあなたの同盟者になる可能性もありますし、相手になる可能性もあります。しかし、あなたがその関係をどのように定義するかによります。
この人物が共同で作成したCiceroは、そのゲームの世界トッププレイヤーと同じくらい優れたものになりました。外交のように戦略的に複雑なゲームで人間レベルでプレイできるエージェントは、協調AIにとって真のブレークスルーです。ヤン・ロンはそれを「対話を意識した戦略」と表現しています。これは素晴らしい表現方法です。つまり、すべての相手との対話を意識する必要がある戦略ゲームです。
要するに、これはAIの領域で成功を収めた人物であり、OpenAIで働いています。そして今日、彼はこう投稿しました。「1年前にOpenAIに加わったとき、ChatGPTの成功が長期的な研究から段階的な製品の微調整に焦点をシフトさせるのではないかと恐れていました。」これは外部からのOpenAIに対する一部の人々の認識です。ただ製品を出して、ここかしこを微調整して改善するだけで、それが現状だと。しかし彼は言います。「しかし、すぐにそうではないことが明らかになりました。OpenAIは、強い確信に基づいて野心的な研究方向に大きな賭けをすることに優れています。」
ちなみに、これはサム・アルトマンのモットーです。彼の投資キャリアがどのように進んだかを見ると、スタートアップへの投資の成功の秘訣は、多額の資本を必要とする長期的なプロジェクトに焦点を当てることだと彼は言っています。そして彼は言います。その分野で競争している人はあまりいません。人々は迅速なリターンを望んでいます。人々は将来の野心的なプロジェクトや目標に大きな賭けをしたくありません。そしてもしあなたがそれをすることができ、成功裏にそれを行うことができれば、報酬は巨大です。そしてここでノームは、OpenAIがまだその方向に進んでいることを支持しています。それはまだ起こっています。彼らはまだ野心的なプロジェクトに大きな賭けをしています。それらは長期的で、遠い将来のものであり、彼らは確信を持ってそれらを支持しています。
一方で、OpenAIチームは舞台裏で忙しいようです。彼らが何をしているかを垣間見ようとし、新しいものが出てくる証拠の断片を引き出そうとする人が多いため、今では様々な新しい実験を隠そうとしているようです。それらを明白にしないようにマスキングすることで。以前はChatGPTと呼ばれていたものが、音声アルファに含まれているようです。つまり、これは小さな選ばれたグループのアルファテスターにロールアウトされている音声デモ、音声エンジンだと思います。それが何か3199という数字の文字列に改名されたようです。それを少し隠そうとしているようです。それほど明白にしないようにしています。
他のすべての様々な新しい進歩と新機能に私がどれほど興奮しているかと同じくらい、他のすべてのAIモデル、様々なテキストから動画へのプラットフォーム、AnthropicIの新リリースは素晴らしいものでした。しかし、これらすべての開発がどれほど興奮させるものであっても、OpenAIが地下の研究室で何か狂ったものを秘密裏に調理していると思います。そしてそれがリリースされるとすぐに焦土と化すと思います。なぜなら、彼らが現在インフラを構築しているすべてのプロジェクトに急速に適用されるからです。これが私の推測です。年末までにはわかるでしょう。正しいか間違っているかをお知らせし、このビデオを参照します。
一方、この人物NAKLEAは、言語モデルを使ってFactorioのすべてを自動化できると確信しているようです。そして、オープンソースのLLAMA 3か、彼ら自身のバージョン、彼ら自身の微調整バージョンを使用するようです。それは独自にFactorioをプレイし始めているようです。
私だけでなく、皆さんにとっても、これは信じられないほど興奮させるもので、興味深く、ただ魅力的です。言語モデルを使ってゲームを自動化することについて、何か非常に興奮させるものがあります。私にはなぜかよくわかりませんが、これがより現実的になり、一般の人々にとってよりアプローチしやすくなるのを待ちきれません。
私はWorld of Warcraftでボット化を実験したことがあります。それが何かわかるでしょうか。しかし、それらは単純なスクリプトベースのボットでした。多くの人々がそのゲームでボットを使用することを好まなかったことはわかります。しかし、私や他の多くの人々にとって、そのような小さなシステム、小さな自動化、24時間365日あなたの命令を実行する小さなボットを作成することには、奇妙な魅力と満足感があります。それらを調整し、最適化し、改善することができます。
そしてもちろん、ビジョン推論スキルとこれらのゲームとインタラクトする能力を持つ大規模言語モデルは、その点で次の大きなものになるでしょう。
ちなみに、もしあなたがたちの誰かがこのようなもの、似たようなもの、AIと特に大規模言語モデル、そしてそのような性質のものとゲーム、自動化などの交差点にあるものを構築している場合は、教えてください。私はできる限りの方法で助けたいと思います。特に、ビデオやチュートリアルのようなコンテンツを作成している場合は、その主題についてのカバレッジを提供することを喜んでいます。
特に、技術的なバックグラウンドを持つ人だけでなく、技術に詳しくない人にとっても役立つものを作成している場合、それが人々がこの世界に入り込むのに役立ち、LLMでの作業の水面下に足を踏み入れるのに役立つ場合は、教えてください。そのようなことをしている場合は、私に知らせてください。できる限りの方法でそれに光を当てることを喜んでいます。
以上、私の名前はウェス・ロスです。ご視聴ありがとうございました。

この記事が気に入ったらサポートをしてみませんか？