見出し画像

GPT-4oを開発したOMNIチームとは?

本日のサム・アルトマンのXへのポストはこの様なものでした。
オムニチームを率いてGPT-4oの開発をつづけリリースにこぎつけたプラフラ・ダリワル氏のポストを引用して彼の功績を称えています。彼のリーダーシップのもと、Omniチームは完全にネイティブなマルチモーダルモデルであるGPT-4oを開発しました。

GPT-4o は、プラフラ・ダリワルの長い期間にわたる次のようなビジョン、才能、信念、決意がなければ実現しなかったでしょう。それが (他の多くの人々の研究とともに) コンピューターの使用方法に革命をもたらすことを私は望んでいます。

サム。アルトマン

GPT-4o (o は「オムニ」の意) は、オムニ チームから生まれた最初のモデルであり、OpenAI の初のネイティブで完全なマルチモーダル モデルです。この立ち上げは組織全体にわたる大規模な取り組みでしたが、この魔法のモデルを可能にした数名の素晴らしいチームメンバーに敬意を表したいと思います。

ラフラ・ダリワル

ChatGPTのGPT-4oモデルとは?

GPT-4o(oは「omni」を意味する)は、OpenAIが開発した完全にマルチモーダルなモデルです。マルチモーダルモデルとは、テキストだけでなく、画像、音声、動画など複数のモダリティ(入力形式)を処理し、理解できるAIモデルのことを指します。GPT-4oは、これまでのテキストベースのモデルとは異なり、さまざまな種類のデータを統合的に処理できるため、より高度なタスクを実行できるようになっています。

この新しいモデルの開発は、AIの利用方法に革命をもたらすことが期待されており、サム・アルトマンはそれを強調しています。特に、Prafulla Dhariwalのリーダーシップとチームの協力がこの成果を可能にしたと強調しています。

GPT-4oの前身、GPT2-chatbotについて

GPT2-chatbotは、2024年4月末に一瞬だけ公開され、その後すぐに撤回された非常に高性能なチャットボットです。このモデルは、LMSYS ChatというAIモデルのベンチマークサイトで短期間公開され、その性能は現行のGPT-4モデルと同等、またはそれ以上と評価されました​。

多くのAIコミュニティメンバーや専門家は、このGPT2-chatbotが実際にはOpenAIの次世代モデルであるGPT-4oのプロトタイプだったのではないかと考えています。Sam Altmanもこのモデルについて言及し、「im-a-good-gpt2-chatbot」や「im-also-a-good-gpt2-chatbot」といったツイートを行っています。これが新しいモデルのテストだった可能性が高いです。

GPT2-chatbot騒動については下記のNoteにまとめていますので合わせてご覧ください。

実はPrafulla Dhariwalにもサーガがある

このポストをしたgoogle bardというふざけたアカウントをご存知でしょうか?彼は、初期の結成時のコメント(注01)を引用してスーパーアライメント崩壊を示唆したポストにリポストして、この様に述べています。

スーパーアラインメントチームは、とにかく最初からずっと空洞化している。おそらく、壁に書かれた文字を見て、アントロピックに行くポイントに到達するだろう

これは、スーパーアライメントチームはずっと機能していなかった事、退職した2人はClaudeを開発しているアンソロピックに合流する事を示唆しています。

※注01:添付のスクショを翻訳するとこうなります。「Ilya Sutskever (OpenAI の共同創設者兼主任研究員) は、これを研究の中核に据えており、Jan Leike (アライメント責任者) と共同でチームを率いることになります。 チームには、以前の調整チームの研究者とエンジニアに加え、社内の他のチームの研究者も参加しています。」つまりスーパーアライメントチームとして結成された主要メンバーが2人昨日退職した事になります。

google bardとは

このgoogle bardというアカウントがGPT2-chatbot開発の中心人物であったことから、Prafulla Dhariwalのaltアカウントとされています。

Prafulla DhariwalさんがGPT2-chatbotを作成した人物であり、彼のXアカウントが「google bard」であることについてこれを裏付ける情報をいくつかのソースから確認しました。

  1. Prafulla Dhariwalは、OpenAIの主要な研究者の一人であり、GPT-2を含む多くの重要なプロジェクトに関与しています。彼の専門知識と技術が、GPT2-chatbotの開発にも大いに貢献していることが考えられます。

  2. GPT2-chatbotは、一瞬だけ公開され、その後すぐに撤回された非常に高性能なチャットボットで、これがGPT-4oのプロトタイプであった可能性が高いです。Sam Altmanもこれについていくつかのツイートをしています​ (注02)。

  3. Prafulla DhariwalのXアカウントに関しては、彼の活動やプロジェクトについての情報が多く投稿されており、彼が「google bard」としても知られている可能性が高いです。

※注02 :下記のサイトを参照してください。

Prafulla DhariwalとGoogle Bard

  1. サム・アルトマンのツイート: サム・アルトマンは「ADHDは開発の中盤で力を発揮する」といったツイートをしており、これは開発者たちの特性がプロジェクトの進行にどのように影響するかについて述べています。このADHDと言われた開発者こそPrafulla Dhariwalではないかと推論します。

  2. Google BardのOpenAIからの離脱: Google Bard(Prafulla Dhariwal)は、OpenAIにいることで多くの制約があり、思うように開発が進まないため、OpenAIを離れたという情報があります。その後すぐにGPT2-chatbotが発表されました。そして、GPT-4oがスプリングアップデートライブでリリースされた事を受けて、「もう地下に潜らなくてもよくなったね!」とのコメントが筆者の目に止まりました。

  3. omniチームが主要開発チームとなった結果:主任科学者であったイリヤ・サツケヴァー氏率いるスーパーアライメントチームの離脱となった様です。かねてからこのチームの一員であったCollin Burnss氏もスパイ容疑をかけられて退職しています。退職後はテスラに入社しました。果たして情報の漏洩をアンソロピックに行っていたのか、xAIに行っていたのかはわかりません。彼のOpenAIでの功績については別のNoteに詳しく解説していますので合わせてご覧ください。

ADHD開発者の使い所

サムがPrafulla Dhariwal氏をADHDだと断定しているわけではないのですが、google bardアカウントはGPT2アカウントとnot deepfateというアカウントも持っており、ご本人のPrafulla Dhariwalを入れて激しく途切れる事なくどのアカウントでも大量ポストをしていることから極度の多動体質だとわかります。

サムはこの大人の発達障害者を実にうまくハンドリンクしているのではないかと思われますので考察してみます。

ADHDの特性と集中力

ADHDの人々は、一見すると忙しなく動き回ることが多いですが、一旦興味を持ったことに対しては驚くほどの集中力を発揮することがあります。これは「ハイパーフォーカス」と呼ばれ、数時間にわたって一つのタスクに没頭することができます。この特性は、特に創造的な分野や技術開発の現場で強力な武器となります。

ハイパーフォーカスとその利点

ハイパーフォーカスとは、ADHDの特性を持つ人々が一つのタスクに異常なまでに集中する状態を指します。この状態では、数時間にわたって深く集中し、驚異的な生産性を発揮することができます。これは、創造的な作業や複雑な問題解決において非常に有利です。

サム・アルトマンとOpenAIのアプローチ

サム・アルトマンは、多様な才能を持つ人々がその才能を最大限に発揮できる環境を提供することの重要性を理解しています。これは以下のような方法で実現されています:

  1. 柔軟な労働環境: 社員が最も集中しやすい時間帯や場所で働けるようにすることで、生産性を最大化します。

  2. プロジェクトの選択権: 社員が興味を持つプロジェクトに取り組むことができるようにすることで、モチベーションと集中力を高めます。

  3. サポートと理解: ADHDの特性を持つ社員が必要とするサポートを提供し、彼らの強みを活かす方法を模索します。

ADHDのプラフラ・ダリワル氏は効果的加速主義だった!

イリヤ・サツケヴァーとサム・アルトマンの間の対立を「効果的利他主義」と「効果的加速主義」の対立として捉える見方があります。この対立について詳しく見ていきましょう。

効果的利他主義 (Effective Altruism)

効果的利他主義(EA)は、リソースを最も効果的に活用して最大限の善を行うことを目指す哲学および社会運動です。AIの文脈では、AI技術がもたらす潜在的なリスクとその管理に焦点を当て、安全かつ倫理的に技術を発展させることを重視します。イリヤ・サツケヴァーが代表するこの立場は、以下の点に重きを置きます:

  • AIの安全性: AIが人類に危害を与えないようにするための研究。

  • 倫理的整合性: AIが人間の価値観や倫理に沿った行動を取ることを確保。

  • 長期的リスク管理: 将来的なAIのリスクを予見し、対応策を講じる。

効果的加速主義 (Effective Accelerationism)

効果的加速主義(e/acc)は、技術革新を最大限に推進することで人類の進歩を加速させることを目指します。この立場は、AIの開発と導入を迅速に進めることが重要であり、技術の進歩が人類全体に利益をもたらすと信じています。サム・アルトマンが代表するこの立場は、以下の点に重きを置きます:

  • 技術革新の推進: AI技術の開発と展開を迅速に進める。

  • 経済的利益: AI技術が経済的な成長と発展をもたらす。

  • 競争優位性: 他国や他社に対する競争力を維持するための迅速な技術導入。

対立の背景

この対立は、AIの開発とその社会的影響に関する根本的な哲学の違いに起因しています。イリヤ・サツケヴァーはAIの安全性と倫理性を重視し、慎重なアプローチを推奨しています。一方、サム・アルトマンは技術の迅速な開発と導入を推進し、その経済的および社会的利益を重視しています。

現在の状況

この対立は、AI業界全体の方向性にも影響を与えています。スーパーアライメントチームや他のAI研究チームの動向も、この対立の影響を受けています。OpenAI公式ではスーパーアライメントチームへの募集をかけていますので、チーム自体が解散するのではなく効果的加速主義に沿ったチームの再編成が行われていくものと思われます。

命名ルールの変更

イリヤ・サツケヴァー氏が開発したGPT-1が元となりGPTはナンバリングされてきました。しかしながらGPT-2の主力開発者はPrafulla Dhariwal氏でした。そのため、サム・アルトマンはナンバリングでモデルのアップデートをするのではなく、MacOSの様な名前をつける事を考えているのではないかと示唆されます。その第一弾がGPT OMUNI(ChatGPT 4o)であると考えられます。

本日のgoogle bard

おまけで、Prafulla Dhariwal氏のalt google bardのツイートを載っけておきますね。
これは、1月5日に大役を仰せつかった時の心境を表したものを、本日懐かしんでいるポストです。

このミームとツイートは、知識の探求とその結果についての諷刺と深い洞察を提供しています。魔法使いが呪われた書を開くことによって自ら呪われるという状況は、自己責任や知識のリスクを示唆し、日常生活や学問の探求における教訓を含んでいます。また、今日のツイートは、その日その日で立場が変わることを象徴しており、知識の双方向性と人生の多様性を強調しています。

これは、解説する必要もないですね。事実は見たままって事ですね。

この記事が気に入ったらサポートをしてみませんか?