見出し画像

OpenAIから次世代の生成AI「o1-preview」 登場! AGIに一歩近づいたかも?!

2024年9月12日、いろいろ噂されていたOpenAIの新生成AIモデル「o1 (オーワン)」がリリースされました。早速試してみましたのでここでご紹介します。


1.モデルの概要
新しい生成AIモデルですので、様々な特徴がありますが、ポイントは以下となります。

  • 科学・コーディング・数学の推論に特化したモデル

  • OpenAI o1とOpenAI o1-miniの2種類

  • 現在はpreviewで、機能と性能は限定的

  • GPT4の後継モデルではない

  • OpenAI o1はリミットが30回/weekとまだ限定的な公開

  • 値段 : OpenAI o1はGPT4oの約6倍とかなり高い

詳細は公式サイトご参照ください(1)。

GPT4oと比較して、o1-previewは以下の様にコーディングやデータ分析・数学に強いことがわかります。既存の生成AIでは、なかなか満足のいく精度が出せなかった分野で活躍しそうですね。ただ論理的な思考を鎖で繋げるようにして(Chain of Thought・思考の連鎖)答えを出すので、回答にかなり時間を要することもあり、リアルタイムの回答が求められるタスクには向かないと思います。

GPT-4oと比較した各タスクでの優位性



2.Game24にチャレンジ
それでは、o1-previewの実力を早速試してみましょう。生成AIが苦手なタスクとして、よく例に上がるものにGame24があります。
これは簡単な数学パズルで以下のルールで行います

  • 与えられた4つの数字と基本的な算術演算(加算・減算・乗算・除算)を使う

  • 結果が24になるような式を作る数学パズル

  • 与えられた4つの数字は1回だけ使えます。

  • 例:13,10,9,4 → (10 - 4) × (13 - 9) 

o1-previewで試行すると以下の結果になりました。見事に答えてますね。回答には約15秒かかっています。内部でいろいろ試したためと考えられます。

o1-previewでのGame24試行結果

GPT4oでやってみると

GPT4oでのGame24試行結果

とうまく答えてくれません。やはり論理展開に強いo1の優位性が際立つタスクと言えそうです。



3.今後の生成AIに与える影響
o1が新しい能力を獲得した背景に、Chain of Thoughtを内部に取り込んで、タスクに応じた思考の連鎖を生成し、より確実に正しい答えを生成することが可能になったことがあります。ただ、正しい答えを導き出す過程を示すChain of Thoughtはユーザーには公開されません。これは少し残念ですね。ユーザーは正しい答えだけでなく、「何故その答えが導き出せたのか」も合わせて理解したいと通常は考えるからです。したがってややブラックボックスと感じるのは致し方ないかと思います。この部分はオープンソースの開発陣が今後研究して、世の中に還元してくれることを期待したいと思います。LlamaやGemmaなど、今は素晴らしいオープンソースの生成AIも多数ありますので、近い将来、Chain of Thoughtをユーザーが検証することも可能になると考えています。


いかがでしたでしょうか。o1-previewは、GPT4が2023年3月に出て以来の衝撃を持って世の中に迎えられているようです。次回はこの素晴らしい生成AIを支える技術を、外部からの推測になりますが考えていきたいと思います。お楽しみに。それでは今日はこのへんで。Stay tuned!


1) Introducing OpenAI o1, OpenAI, Sep 12, 2024  




Notice: ToshiStats Co., Ltd. and I do not accept any responsibility or liability for loss or damage occasioned to any person or property through using materials, instructions, methods, algorithms or ideas contained herein, or acting or refraining from acting as a result of such use. ToshiStats Co., Ltd. and I expressly disclaim all implied warranties, including merchantability or fitness for any particular purpose. There will be no duty on ToshiStats Co., Ltd. and me to correct any errors or defects in the codes and the software.

いいなと思ったら応援しよう!