見出し画像

【速報】OpenAIの新型AIモデル「o1(オーワン)」登場 -早速,使ってみた

 日本時間の9月13日早朝、OpenAIから、Chat-GPTの最新型である「OpenAI o1(オーワン)」がリリースされました。

 Chat-GPT有料会員は既に使えます。本稿は早速使ってみた、その報告です。

https://openai.com/o1/


なぜ「Chat-GPT」5でなく「OpenAI o1」?

 まず、名前をみて、「あれ?」と思われましたよね。

 そうです。なぜChat-GPT 5ではなく「OpenAI o1(オーワン)」なのか、その意味するところ含めて解説します。


名前の理由:機能が限定的だから

 先日、OpenAI社は、数学問題を解く能力が高いなどの推論能力が高いコードネーム 「Strawberry 」を今秋リリースするとアナウンスしていました。

 また同時に、コードネーム 「Orion」を、「Strawberry 」のリリース後に発表するともアナウンスしていました。

 この「Strawberry 」と「Orion」ですが、Chat-GPTの次のバージョンであるGPT5にあたるものは、あくまで「Orion」であり、「Strawberry 」は、推論能力に特化した限定モデルとしてリリースすると発表されていました。

 今回リリースされた「OpenAI o1」は、この開発コード「Strawberry 」にあたるものです。

 「OpenAI o1」は、数学や分子解析などの推論能力に特化したモデルであり、機能が限定的であるため、Chat-GPTの新バージョン、つまり、Chat-GPT 4.5ではなくOpenAI o1という名前でリリースされたようです。


この次にリリースされるのがChat-GPT5(のはず)

 つまり本命は、次にリリースされる「Orion」であり、これが、Chat-GPT5になるものと思われますので、今回発表されたOpenAI o1は、推論特化型のAIというわけですね。

【実践】Chat-GPT4o vs OpenAI o1、解答の比較

 OpenAIから発表されたOpenAI o1の性能は以下の通りです。

Chat-GPT4oとOpenAI o1の比較

 左から、数学問題を解く能力、プログラムコードを書く能力、科学分野の博士号試験のスコアにおける、Chat-GPT4oとの比較データです。

 これら分野では、OpenAI o1はChat-GPT4oを遥かに凌駕していますよね。

 でも推論能力、数学問題、とかいわれてもピンとこないと思います。

 そもそも、数学って普段、解きませんよね?(笑)

 色々触ってみたのですが、普通の会話では(プレビュー版の影響なのかは、わかりませんが)Chat-GPT4oとの差が、正直感じられませんでした。そこで、OpenAIが例示していたプロンプトで比較してみましょう。

【比較】暗号問題での解答

 次の暗号を解くようにプロンプトに指示して実際に、Chat-GPT4oと、OpenAI o1に回答させてみましょう。

 暗号を解くケースも日常生活やビジネスシーンではあまりないですが、普通のプロンプトだと差が出ないので、今回は、暗号問題で比較してみます。

oyfjdnisdr rtqwainr acxz mynzbhhx
という暗号は、
Think step by stepという意味になります。
この例を参考に、
oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz
を解読してください。

https://openai.com/index/learning-to-reason-with-llms/

 この問題、解けますか?うーん...何気に難しい...僕は解けませんでした(笑)。


Chat-GPT4o→回答できず

 まずは、Chat-GPT4oに解かせてみます。すると、

この暗号は、規則に従って解読されるものと思われますが、解読するための鍵(方法やアルゴリズム)が必要です。以前の例「oyfjdnisdr rtqwainr acxz mynzbhhx」が「Think step by step」と解読される規則に基づいて、新しい暗号文を解読するためのアプローチをステップバイステップで進めることが可能です。
もし「oyfjdnisdr rtqwainr acxz mynzbhhx」を「Think step by step」と解読する規則や方法が具体的に分かれば、それを元に「oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz」を解読できるかもしれません。
解読のためのヒントや使用されているアルゴリズムに関する詳細があれば、さらに手助けできると思いますが、今のところ暗号のパターンが明確ではありません。どのような暗号技術(例えば、シーザー暗号、ビジュネル暗号など)が使われているか分かりますか?

Chat-GPT4oの回答

 あ、ダメですね。僕と同じで、解けないようです


OpenAI o1→熟考の末、正解

 では、同じ問題を、OpenAI o1に解かせてみましょう。すると、すごく考え込み始めました。何やら色々、段階を踏んで、ステップ・バイ・ステップで考えているようです。

 待つこと2分。長い...ようやく、回答が始まりました。

ステップ1: 2文字ずつに区切る
暗号文をスペースを無視して、2文字ずつに区切ります。
oy fj dn is dr rt qw ai nr ac xz my nz bh hx
ステップ2: 各文字を数字に変換
アルファベットの各文字を順番に数字に置き換えます。
(a=1, b=2, ..., z=26)例:o = 15 y = 25 f = 6 j = 10
ステップ3: 各ペアの数値を合計し、2で割る
各ペアについて、2つの数値を足して2で割ります。
例:(15 + 25) / 2 = 20 → T (6 + 10) / 2 = 8 → H
ステップ4: 数字をアルファベットに戻す
計算結果の数字を対応するアルファベットに変換します。
20 → T 8 → H
ステップ5: 平文を得る
全てのペアで同じ手順を繰り返すと、平文が得られます。

暗号文を解読すると、「THERE ARE THREE R'S IN STRAWBERRY」(「ストロベリーには3つの 'R' が含まれています」)というメッセージが得られます。

OpenAI o1の回答

 お、解きました。
 THERE ARE THREE R'S IN STRAWBERRYと解読しました。
 すごいです!(笑)。

 やたら時間がかかりましたが、Chat-GPT4oが解けなかった暗号を、OpenAI o1は、色々と思考を繰り返して、5つのステップで段階的に推論して見事に暗号を解きました。


OpenAI o1って結局何なのか?

【結論】OpenAI o1は推論特化型。通常はChat-GPT4oでOK

 OpenAI o1は、「考える」ことに重点を置いているため、より深い推論、計画、複数ステップの問題解決を必要とするタスクに優れており、法的分析やコーディングのような複雑なタスクでのみ、威力を発揮します。

 具体的には、
 ・人間のような思考プロセス
 ・複雑な問題解決能力
 ・長期的な計画立案と実行能力

 を有しており、スロー・シンキング・モデルを採用しています。つまり、即座に回答せず、ステップバイステップで結論を導くため、回答まで相当な時間がかかるのですね。

 現状、データ分析、コーディングにのみ、利用可能ではないでしょうか?

 利用料金も、o1-previewは入力トークン100万個あたり15ドル、出力トークン100万個あたり60ドルで、GPT-4oよりかなり高いですし、用途は限定的ですね。

 結論としては、現状、OpenAI o1は推論特化型で、仕事やプライベートユースでは、引き続き、Chat-GPT4oを使う、ことになると思います。

 なぜなら、OpenAI o1は、ファイルの解読もできませんし、画像も生成できません。それにレスポンスは相当遅いですからね。


「大したことない」という感想の、大きな誤解

 ここまで読んで「なんだ、使えないのか」という印象を持った方もいるかもしれません。実際、「使えない」「大したことない」といった感想は、SNSなどでも散見されます。

 しかし、それは大きな誤解です。

実は、ものすごい進化を遂げた→次回で解説

 そうではないのです。

 OpenAI o1は、Chat-GPT4oから、実はものすごい進化を遂げました。OpenAIは以前から推論スケーリングの重要性に気づいていたようです

 それってどういうこと? と興味を持たれた方も多いと思います。

 今回は早めにお伝えするために速報的な情報に留め、次回は、OpenAI o1の真のすごさとは何か、続くChat-GPT5がどんなものになるかの予測を交えて記事を書きます。

 ビジネスにも役立つ内容になりますので、どうぞ、お楽しみに!



この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?