OpenAIの新モデル「o1」は専門的でカワイイ
久しぶりにワクワクするニュースです。
現地時間の9月12日、アメリカのOpenAI社は新しいモデル「o1(オーワン)」を公開しました。噂では、コードネームStrawberryで開発されていたもののようです。
てっきり公開に際して、ChatGPT-4.5等で公開すると思っていましたが、心機一転「o1」として公開されています。なお、現時点では「preview」版と「mini」版が公開されています。(推測を含みますが、o1シリーズとして公開し、ChatGPT-n系はおそらく別途開発されているようです。今年中に来るといいね!GPT-5!)
https://openai.com/index/introducing-openai-o1-preview/
使ってみた感想としては、人間のように熟考して解答している印象を受け、回答の精度も主観ですが向上している印象を受けました。
この考えています、ですがクリックするとその思考プロセスを確認できます。
さながら複数のChatGPTが寄り集まって会議しているようで面白いです。
特に複雑な推論にも長けており、相対性理論が用いられる課題にも正確に回答できています。(↓やりとり全量はChatGPTのリンク参照)
特に、ポリシーに準拠し、計算を二重確認し、禁止された内容を避けて…の辺りは内部的な指示のようですね。
ちなみにこの辺を質問すると、比較的塩対応されます。(厄介な客が来た時に、裏でゴニョゴニョしているそれ。)
ほか、噂ではかなり回答が遅いという話でしたが、実用に耐えるレスポンスだと感じました。考える、といっても30秒以内におさまっており、そこからの回答の生成もかなり早かったです。
ただし、o1-preview の週ごとのレート制限は 30 メッセージということで、かなり厳しいですね。週ですよ、週!公開されたばかりのGPT-4を思い出します。
加えて、現時点でWEB検索の機能や、画像生成はできません。4oがある以上、する必要もない気もしますが、こちらは後々アップデートで追加されるようです。
まとめ
個人的にはかなり期待以上でした。特に懸念されていた応答速度も申し分なく、実用に耐えられるものだと感じました。ただし、今後利用者が増えるに従って、このパフォーマンスが維持できるのかは気がかりです。
また、現時点で利用制限も厳しいので、この辺緩和されることを願います。とはいえ、これ1つのリクエストをこなすのに、相当お金がかかっているものと思います。致し方がないのでしょう。
加えて、思考中のプロセスが明らかになるのは良いですね。見ていて面白いです。論理的であることと、個性的であることが両立していて参考にもなる気がします。
全体的に主観ですが、
ChatGPT-4o < Claude3.5 < o1
の印象は受けています。
この記事が気に入ったらサポートをしてみませんか?