【速報】OpenAIの新型AIモデル「o1(オーワン)」登場 -早速,使ってみた
日本時間の9月13日早朝、OpenAIから、Chat-GPTの最新型である「OpenAI o1(オーワン)」がリリースされました。
Chat-GPT有料会員は既に使えます。本稿は早速使ってみた、その報告です。
なぜ「Chat-GPT」5でなく「OpenAI o1」?
まず、名前をみて、「あれ?」と思われましたよね。
そうです。なぜChat-GPT 5ではなく「OpenAI o1(オーワン)」なのか、その意味するところ含めて解説します。
名前の理由:機能が限定的だから
先日、OpenAI社は、数学問題を解く能力が高いなどの推論能力が高いコードネーム 「Strawberry 」を今秋リリースするとアナウンスしていました。
また同時に、コードネーム 「Orion」を、「Strawberry 」のリリース後に発表するともアナウンスしていました。
この「Strawberry 」と「Orion」ですが、Chat-GPTの次のバージョンであるGPT5にあたるものは、あくまで「Orion」であり、「Strawberry 」は、推論能力に特化した限定モデルとしてリリースすると発表されていました。
今回リリースされた「OpenAI o1」は、この開発コード「Strawberry 」にあたるものです。
「OpenAI o1」は、数学や分子解析などの推論能力に特化したモデルであり、機能が限定的であるため、Chat-GPTの新バージョン、つまり、Chat-GPT 4.5ではなくOpenAI o1という名前でリリースされたようです。
この次にリリースされるのがChat-GPT5(のはず)
つまり本命は、次にリリースされる「Orion」であり、これが、Chat-GPT5になるものと思われますので、今回発表されたOpenAI o1は、推論特化型のAIというわけですね。
【実践】Chat-GPT4o vs OpenAI o1、解答の比較
OpenAIから発表されたOpenAI o1の性能は以下の通りです。
左から、数学問題を解く能力、プログラムコードを書く能力、科学分野の博士号試験のスコアにおける、Chat-GPT4oとの比較データです。
これら分野では、OpenAI o1はChat-GPT4oを遥かに凌駕していますよね。
でも推論能力、数学問題、とかいわれてもピンとこないと思います。
そもそも、数学って普段、解きませんよね?(笑)
色々触ってみたのですが、普通の会話では(プレビュー版の影響なのかは、わかりませんが)Chat-GPT4oとの差が、正直感じられませんでした。そこで、OpenAIが例示していたプロンプトで比較してみましょう。
【比較】暗号問題での解答
次の暗号を解くようにプロンプトに指示して実際に、Chat-GPT4oと、OpenAI o1に回答させてみましょう。
暗号を解くケースも日常生活やビジネスシーンではあまりないですが、普通のプロンプトだと差が出ないので、今回は、暗号問題で比較してみます。
この問題、解けますか?うーん...何気に難しい...僕は解けませんでした(笑)。
Chat-GPT4o→回答できず
まずは、Chat-GPT4oに解かせてみます。すると、
あ、ダメですね。僕と同じで、解けないようです。
OpenAI o1→熟考の末、正解
では、同じ問題を、OpenAI o1に解かせてみましょう。すると、すごく考え込み始めました。何やら色々、段階を踏んで、ステップ・バイ・ステップで考えているようです。
待つこと2分。長い...ようやく、回答が始まりました。
お、解きました。
THERE ARE THREE R'S IN STRAWBERRYと解読しました。
すごいです!(笑)。
やたら時間がかかりましたが、Chat-GPT4oが解けなかった暗号を、OpenAI o1は、色々と思考を繰り返して、5つのステップで段階的に推論して見事に暗号を解きました。
OpenAI o1って結局何なのか?
【結論】OpenAI o1は推論特化型。通常はChat-GPT4oでOK
OpenAI o1は、「考える」ことに重点を置いているため、より深い推論、計画、複数ステップの問題解決を必要とするタスクに優れており、法的分析やコーディングのような複雑なタスクでのみ、威力を発揮します。
具体的には、
・人間のような思考プロセス
・複雑な問題解決能力
・長期的な計画立案と実行能力
を有しており、スロー・シンキング・モデルを採用しています。つまり、即座に回答せず、ステップバイステップで結論を導くため、回答まで相当な時間がかかるのですね。
現状、データ分析、コーディングにのみ、利用可能ではないでしょうか?
利用料金も、o1-previewは入力トークン100万個あたり15ドル、出力トークン100万個あたり60ドルで、GPT-4oよりかなり高いですし、用途は限定的ですね。
結論としては、現状、OpenAI o1は推論特化型で、仕事やプライベートユースでは、引き続き、Chat-GPT4oを使う、ことになると思います。
なぜなら、OpenAI o1は、ファイルの解読もできませんし、画像も生成できません。それにレスポンスは相当遅いですからね。
「大したことない」という感想の、大きな誤解
ここまで読んで「なんだ、使えないのか」という印象を持った方もいるかもしれません。実際、「使えない」「大したことない」といった感想は、SNSなどでも散見されます。
しかし、それは大きな誤解です。
実は、ものすごい進化を遂げた→次回で解説
そうではないのです。
OpenAI o1は、Chat-GPT4oから、実はものすごい進化を遂げました。OpenAIは以前から推論スケーリングの重要性に気づいていたようです。
それってどういうこと? と興味を持たれた方も多いと思います。
今回は早めにお伝えするために速報的な情報に留め、次回は、OpenAI o1の真のすごさとは何か、続くChat-GPT5がどんなものになるかの予測を交えて記事を書きます。
ビジネスにも役立つ内容になりますので、どうぞ、お楽しみに!
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?