見出し画像

Google Gemini -2 リリース? Google の新ロボット、Sam Altman 訴訟、秘密の詳細が明らかに

AI Grid へようこそ。今日の動画では、AI に関する最も重要なニュースをいくつか見ていきます。この週は AI にとってかなり大きな週になるでしょう。噂やリークに信憑性があるとすれば、以前はある程度の信頼性がありました。
ここで見られるのは、チャットボットアリーナです。多くの方がご存知かもしれませんが、チャットボットアリーナは1つのプロンプトを入力すると、ランダムに2つの別々のモデルに送信され、どちらの応答が良いと思うかを選択し、その後どのモデルかを明かすエリアです。
興味深いことに、ここ数日で、チャットボットアリーナにのみ登場する謎のモデルがあることがわかりました。このモデルは何と呼ばれているでしょうか。ミステリー Gemini 2 と呼ばれています。
このモデルは最近トレーニングされたばかりのようです。なぜなら、ある人が尋ねた質問は、最近 Twitter で話題になったばかりのものだったからです。もちろん、これは悪名高いイチゴの質問です。「Strawberry」にはいくつの「R」がありますか? 「strawberry」という単語には3つの「R」があります。
興味深いことに、Gemini 2 は「過去にいくつかのモデルがこの質問に苦戦したようですが、正解は3つであることを確認できます」と答えています。これは、モデルがインターネットを閲覧できるか、あるいは最近トレーニングされたばかりで、イチゴ論争に関する最新のデータを理解しているのかもしれません。
イチゴ論争をご存じない方のために説明すると、最近人々は、LLM に「strawberry」という単語の「R」の数を数えるよう頼んでも、実際にはできないことを発見しました。これは、ほとんどの人がまだ理解していないことだと思います。
これはまた非常に興味深いことです。Gemini 2 はチャットボットアリーナでのみ利用可能であるだけでなく、今週初めか今年中にリリースされる可能性があります。数日前に話したように、Google の新しいモデルは実際にチャットアリーナのすべてのランキングで1位になっています。アリーナの ELO は現在 GPT-4o や他の最先端モデルを上回っています。
12日後の今でも、このモデルがアリーナスコアで1位を維持していることがわかります。かなりの数の投票を受けており、このモデルは異なる種類の推論エンジンを使用しています。
以前の動画で言ったように、このモデルを試したい場合は、Google の AI Studio で利用可能です。しかし、これが Google に関する唯一の興味深い情報というわけではありません。
LMS チャットボットアリーナには、3つの新しい非常に有能なモデルがあることもわかります。これらは見つけるのがかなり難しいです。なぜなら、アリーナモードでのみ利用可能だからです。つまり、チャットボットアリーナに質問をして2つのモデルに応答してもらわない限り、このモデルが応答するのを見つけるのは難しいのです。
私がこれについて興味深いと思うのは、ミステリー Gemini 1、一部の人が OpenAI のチャットボットではないかと推測している匿名チャットボット、そしてもちろん別の推測的な Gemini チャットボットである Gemini テストがあることです。
4つの Gemini テストが進行中で、どのモデルをリリースするか決めようとしているようです。Gemini 2、アップグレードされる可能性のある実験版の 1.5 Pro、OpenAI の Project Astra のようなマルチモーダルシステム、あるいは Google のオープンソースの取り組みである可能性もあります。
今年初め、Google が Gemma ファミリーのモデルでオープンソースモデルに焦点を当て始めたことを知っています。チャットボットアリーナでこれらのさまざまな小さな出来事が見られたことについて、私は考えています。前回、モデルが不明で誰が提供したのかわからなかったとき、その翌週に GPT-4o mini が登場し、その前に GPT-4o が登場しました。
以前に何が起こったかを見るのは非常に興味深く、今度は2週間以内に Google から発表があるのではないかと思っています。さらに Google のニュースがあります。これは昨日取り上げる予定だったものですが、今話していることにぴったりです。
覚えているでしょうか、イチゴのアカウント、OpenAI の秘密の新しいスタートモデルについて話していたもの、推論が得意で、すべての驚くべきブレークスルーがあると言われていたものです。彼らは実際にツイートしました。「私のために、複数のステップで考え、いくつかのレポートをダウンロードし、比較分析し、高い能力を持つ PhD レベルで数時間後に戻ってくるようなものを」と言いました。
Google の Logan Kilpatrick が「2025年」と言っているのが見えます。業界全体で 2025年は、自律的で複数の異なることができる変革的な AI を本当に手に入れる年の1つになるようです。これは「2025年」というようなハイプツイートではありません。ただの日付を示しているだけで、物事がもっとクレイジーになろうとしていることを示しています。
以前、2025年という日付を聞いたとき、Jimmy Apples が彼のバイオにその日付を入れていたことを思い出します。Jimmy Apples は、OpenAI の最新モデルと Google の最新発表について一貫して詳細を提供してきた有名な OpenAI リーカーを指しています。
Google はノンストップでアップデートを行っています。AI の分野で誰がボスなのかを思い出させる必要があります。彼らはツイートしました。「卓球をプレイする準備ができた AI パワーのロボット、our を紹介します」。
この背後にある研究は重要だと思います。なぜなら、アマチュアレベルで卓球をプレイできるエージェントがあるからです。ロボット工学に関して見てきた研究の一部は常に重要です。ロボット工学は長らくハードウェアの問題として知られています。
これは、ほとんどの人が異なる産業にわたって苦労している分野です。物理的な世界を扱っているからです。ソフトウェアのようにバグを修正できるわけではありません。物理的な世界では、エラーを反復するためのフィードバックループがはるかに長くなります。
これらは決して安くないことを考えると、全体的な開発が遅くなります。もちろん、これらは非常にデータ集約的です。つまり、トレーニングには多くのデータが必要です。
Google がこのロボットをトレーニングするために使用したアプローチについて、私が気に入った点の1つは、彼らが言っていたことです。「ロボットをトレーニングするために、位置、速度、スピンに関する情報を含む卓球ボールの初期状態のデータセットを収集しました。システムはこのライブラリを使って練習し、フォアハンドトップスピン、バックハンド、ターゲティング、サーブリターンなどのさまざまなスキルを学びました」。
そしてもちろん、これが面白い部分です。「私たちのロボットは最初、卓球の試合の物理学を正確にモデル化できるシミュレーション環境でトレーニングします。実世界に展開されると、人間との対戦でのパフォーマンスに関するデータを収集し、シミュレーションに戻ってスキルを磨き、継続的なフィードバックループを作成します」。
これは、シミュレーション環境を使用して学習能力を加速させることができる AI システムがある実際の進歩の1つのケースです。将来的には、シミュレーション環境とシミュレーションデータが、ロボット工学のブレークスルーを達成する最大の方法の1つになると思います。
野生で起こり得るあらゆる可能なシナリオを網羅するのに十分な物理的データは現在なく、将来的にもないかもしれません。シミュレーション環境は何十億もの異なるシナリオを捉えることができ、AI はそれらでトレーニングされ、新しいケースに対してほぼ準備ができる可能性があります。
これにより、AI はさまざまな異なるタスクを行うのに非常に優れたものになるでしょう。本当に面白かったのは、彼らが言っていたことです。「このシステムは、対戦相手の行動やプレイスタイルを追跡することで、さまざまな対戦相手に適応するように設計されています。例えば、テーブルのどちら側にボールを返す傾向があるかなどです」。
これにより、異なるスキルを試し、成功率を監視し、その場で戦略を調整することができます。研究中、初心者から上級者まで4つの異なるスキルレベルの29人の未知の人間と対戦しました。全体として、ロボットは参加者の中間でスコアを獲得し、中級アマチュアレベルで操作できることを示唆しています。
もちろん、彼らはここで上級プレイヤーに勝てたかどうかについて話しています。簡単に言えば、答えは「いいえ」です。反応速度、カメラの感知能力、スピン、手、パドルのラバーなど、シミュレーションで正確にモデル化するのが難しい物理的およびスキル的な制限があります。
これは、シミュレーション環境がはるかに良くなれば、ロボットに劇的な改善が見られる理由の1つです。より効果的にデータを収集できるようになるからです。これは本当に非常に興味深いことであり、Google は現在最高のチャットボットを持っていないかもしれませんが(アリーナでは現在持っていますが)、依然として本当に重要なさまざまな AI 研究を行っており、それらをロボット工学と組み合わせていることを示しています。
元 Googler は、5年後には世界が認識不可能になるため、私たちの世界にもはや長期的なものはないと述べています。「私たちの世界には長期的なものはもうありません。多くの人が理解していないのは、サイクルの速さです。今日、5年計画を立てている企業は何をしているのかわかりません。5年後の世界は、今日の世界と比べて認識不可能になるでしょう」。
「地政学的、経済的、技術的な変化、人工知能や合成生物学、気候変動など、非常に多くのことが変化しています。キャッシュカウや主力事業には5年計画が必要ですが、イノベーションに5年計画を立てるのは難しいでしょう」。
これは、Google の前チーフビジネス AI オフィサーである Mo Gawdat の発言です。基本的に、AI の反復サイクルが非常に速いため、AI の発展の速さが予測不可能であることから、未来がますます予測不可能になっていると話しています。
未知の未知と効果の効果を予測するのは非常に難しいため、今日の時代に長期的な計画を立てるのは非常に困難です。これが、私が実際に AGI 後の経済コミュニティを作成した理由の1つです。
多くの人が知らないことの1つは、未来が非常に不確実で、準備するのが非常に難しいということです。私は個人的に、生活やビジネス、そして同じようにしたい人々を助けるために、できる限り未来に備えようとしています。
ほとんどの人が気づいていないほど、日々多くの変化が起こっているからです。これが、私の AGI 後の経済コミュニティで、影響を受けているすべての仕事を文字通り追跡するためのデータベースをいくつか作成した理由です。
このデータベースは私のコミュニティでアクセスできます。また、AI のおかげで作られている新しいビジネスチャンスをすべて示す別のデータベースもあります。多くの異なるツールが登場し、お金を稼ぐための多くの異なる産業があります。
もちろん、この機会を利用して恥ずかしげもなく私の AGI 後の準備コミュニティを宣伝します。すぐにアクセスできますが、重要なのは、ほとんどの人が準備をしていないということです。これは非常に難しいことですが、それでも未来で繁栄するチャンスを得たいのであれば、何らかの努力をすることが常に重要です。
興味深いことに、リード・ホフマンは実際にサム・アルトマンを解雇したオープンAIの取締役会は無能であり、これが有能な行動である宇宙は存在しないと述べています。そして、あなた方は何をしているのかわかっていなかったのです。外部からの情報だけでも、非常に無能なことがたくさんありました。
簡単な例から始めましょう。私自身の経験から報告します。木曜の夜、ナパで「The Grow」というイベントがあり、イルヤ・ムラートが私たちと夕食を共にしていました。彼女は夕食から立ち上がり、何かが起こっていると言って去っていきました。朝食時には彼女の姿が見えませんでした。
私が車で去ろうとしていたとき、チーフ・オブ・スタッフがブログ記事を見せてくれました。「サムとグレッグを解雇し、イルヤ・ムラートが暫定CEOになった」というものでした。この時点で私が知っていたのは、彼らが前日の夕食時まで彼女に連絡していなかったということです。
これが有能な行動である宇宙は存在しません。文字通り、サムが昨日誰かを殺害し、殺人で刑務所に入っているような状況でなければならなかったでしょう。「今すぐここに来て」というようなレベルです。わかりますよね。
私たちが知る限り、特定の取締役会メンバーとのコミュニケーションで、彼らが完全な真実を得ていないと感じたことが最終的な理由かもしれません。それでも、それはOpenAIのミッション、人類に有益なAI、組織にとって良いものを目指す運営方法からかけ離れています。
それは無能です。文字通り、そうではありません。これは、OpenAIの内部で何が起こっていたかについての興味深い洞察であり、取締役会による決定が非常に迅速な決定であったように見えることを示しています。
私にとって、この全状況で最も驚くべきことは、私たちが、間違いなく10年で最も重要な企業の1つにいる人々が、非常に急速に、そして潜在的に非理性的に決定を下し、これらの重要な企業のCEOについて数秒で決定を下すことができるという事実でした。
このような無秩序な、あるいは好きなように呼んでください、非組織的な方法が、そのような高レベルの企業で行われているということは、時として人間は人間であり、時として間違いを犯し、時として物事がほころびることがあることを示しています。これは少なくとも注目に値することです。
さらなるOpenAIのドラマでは、イーロン・マスクが最近サム・アルトマンに対して再び訴訟を起こしたことがわかりました。イーロン・マスクが訴訟を取り下げたとき、多くの人はケースが終わり、サム・アルトマンはほぼ無罪放免で、イーロン・マスクは他の事業に集中していると考えていました。
私は本当に、イーロン・マスクが5つの巨大な数十億ドル規模の企業に集中していると思っていましたが、彼はサム・アルトマンに不当な扱いを受けたと感じているため、この訴訟を本当に追求しようとしているようです。
彼は、サム・アルトマンに対する訴訟は利他主義対貪欲の典型的な話であり、この訴訟は実際にはるかに強力なものであると言っています。彼らは、アルトマンが意図的にマスクを誘惑し、欺いたと言っています。AIがもたらす実存的な危険についてのマスクの人道主義的な懸念につけ込み、アルトマンと彼の長年の仲間であるブロックマンは、マスクを彼らの非営利団体の共同設立者に仕立て上げました。
ここで見られるように、マスクがその事業に名前を貸し、多大な時間と数千万ドルの初期資本を投資し、OpenAIのトップAI科学者を採用した後、マスクとその非営利団体の名前は、アルトマンとその共犯者に裏切られました。その欺瞞はシェイクスピア的な規模です。これは物事を表現する面白い方法です。
OpenAIの技術が変革的なAGIに近づくと、アルトマンは物語を反転させ、マイクロソフトとの提携で現金化を進めました。アルトマンは不透明な営利目的のOpenAI関連会社のウェブを確立し、横暴な自己取引に従事しました。
基本的に、この訴訟は実際に、SECがOpenAIとその内部告発者契約について精査し、FTCが苦情を持っていることについても言及しています。この訴訟はOpenAIにとって良くありません。
彼らがこの種の領域をどのようにナビゲートするのか興味深いでしょう。これは確かに新しい領域ですが、この全訴訟が法廷でどのように展開されるのか気になります。
また、マーク・ザッカーバーグがLlamaファミリーのモデルをオープンソース化した理由と、彼の定義を説明しました。これは多くの人々を驚かせました。
「私たちがやっているLlamaのこと、つまり、私たちは明らかにオープンソースに多くを投資しています。私は世界にとって広くより良いものだと思います。私たちはこれを利他主義的にやっているわけではありません。私たちがこれをやっている理由は、Llamaを頼りにできるプラットフォームを構築したいからです」。
「現実は、これはエコシステムであり、私たちが単に構築してデプロイできる単一のソフトウェアではありません。私たちがやっていることに対してすべてのシリコンプロバイダーがすべてのストックを最適化し、他の多くの企業やスタートアップ、さまざまな人々が異なる蒸留ツールや推論ツールを構築して、より速く、より効率的にするときに、それはより良くなります」。
「私の視点からすると、私はみんなに使ってほしいだけです。なぜなら、より多くの人々が使えば使うほど、Llamaをより良くするためのフライホイールがより速く回転すると思うからです。これは非常に利己的で偏狭な答えかもしれませんが、それによって私が構築したいものをより良く構築できるのです」。
「しかし、正直に言うと、人々はその答えに安心すべきだと思います。なぜなら、私たちのオープンソース戦略について人々が持つ大きな疑問の1つは、『なぜこれをやっているのか』ということだからです。あなたはこれを構築し、そしてただ与えてしまうのですか? それは持続可能ですか? Llama 4、Llama 5のトレーニングに何十億ドルもかかるとき、ただ与えてしまうのですか?』そして答えは、『はい、はい』です。私はそれを与えてしまうとは見ていません。私はあなたたち全員が私のためにそれをより良くしていると見ています」。
これは、マーク・ザッカーバーグがAI分野に参入した方法についての興味深い視点です。多くの異なる機関がフロンティアAIモデルにアクセスし、これらのシステムが実際にどのように機能するかを理解できるようにするオープンソース開発を考えると、彼らがやっていることは賞賛に値すると思います。
もちろん、常にオープンウェイトと呼ぶこともできますが、これがAIニュースの動画になければ、イーロン・マスクがGrok 2ベータリリースが間もなく来ると述べていることについて触れないわけにはいきません。
イーロン・マスクに対して不満があるわけではありませんが、Grokをただ単にXプラットフォーム以外でリリースしてほしいと思います。正直に言って、ここでGrokを使用するのは常に素晴らしいわけではありません。
楽しいモードと通常モードがありますが、モデルがひどいと言っているわけではありません。ただ、モデルが長い間出ていて、実際にこのモデルがリリースされたときに知らなかったのです。もちろん、地理的な制限はありますが、モデルを使用したい人として、時々物事が完全に遅れることがとても frustrating になることがあります。
Twitterのメンバーシップを購入しても、広告されていたようにすぐにモデルにアクセスできませんでした。希望としては、Grok 2ベータが実際にここにあれば、どの国がアクセスでき、どのアカウントがアクセスできるかを知ることができればいいのですが。
最初に覚えているでしょうが、GrokはTwitterプレミアムに加入した人にのみリリースされました。

この記事が気に入ったらサポートをしてみませんか?