OpenAIの新モデル「o1」は専門的でカワイイ

2024年9月13日 20:00

久しぶりにワクワクするニュースです。
現地時間の9月12日、アメリカのOpenAI社は新しいモデル「o1（オーワン）」を公開しました。噂では、コードネームStrawberryで開発されていたもののようです。

てっきり公開に際して、ChatGPT-4.5等で公開すると思っていましたが、心機一転「o1」として公開されています。なお、現時点では「preview」版と「mini」版が公開されています。（推測を含みますが、o1シリーズとして公開し、ChatGPT-n系はおそらく別途開発されているようです。今年中に来るといいね！GPT-5！）

https://openai.com/index/introducing-openai-o1-preview/

使ってみた感想としては、人間のように熟考して解答している印象を受け、回答の精度も主観ですが向上している印象を受けました。

考えています、が面白い。
リアルワールドでも使いたいですね。
聞かれた時に頭の上で「考えています」をハイライトさせたい。

この考えています、ですがクリックするとその思考プロセスを確認できます。
さながら複数のChatGPTが寄り集まって会議しているようで面白いです。

特に複雑な推論にも長けており、相対性理論が用いられる課題にも正確に回答できています。（↓やりとり全量はChatGPTのリンク参照）

宇宙旅行と相対性理論に関する思考実験について質問があります。
以下のシナリオを考えてください：
- 光速に非常に近い速度で航行できる宇宙船がある
- この宇宙船で地球から3光年離れた星まで往復する
- 往路で星の周りを一周してから帰還する
このシナリオにおいて：
1. 宇宙船に乗っている乗員にとっての経過時間は？
2. 地球上で観測される経過時間は？
3. なぜこの二つの時間に差が生じるのか？
計算過程と理論的説明を含めて、できるだけ詳細に答えてください。また、この現象が実際の宇宙探査や科学技術にどのような影響を与える可能性があるかについても触れていただけると幸いです。

プロンプト

さながら、わちゃわちゃと集まって会議している様子が浮かんできました。
各トピックを担当する”人”が居るとすれば、その異なる”個性”を感じます。

特に、ポリシーに準拠し、計算を二重確認し、禁止された内容を避けて…の辺りは内部的な指示のようですね。

ちなみにこの辺を質問すると、比較的塩対応されます。（厄介な客が来た時に、裏でゴニョゴニョしているそれ。）

ほか、噂ではかなり回答が遅いという話でしたが、実用に耐えるレスポンスだと感じました。考える、といっても30秒以内におさまっており、そこからの回答の生成もかなり早かったです。

ただし、o1-preview の週ごとのレート制限は 30 メッセージということで、かなり厳しいですね。週ですよ、週！公開されたばかりのGPT-4を思い出します。

加えて、現時点でWEB検索の機能や、画像生成はできません。4oがある以上、する必要もない気もしますが、こちらは後々アップデートで追加されるようです。

まとめ

個人的にはかなり期待以上でした。特に懸念されていた応答速度も申し分なく、実用に耐えられるものだと感じました。ただし、今後利用者が増えるに従って、このパフォーマンスが維持できるのかは気がかりです。

また、現時点で利用制限も厳しいので、この辺緩和されることを願います。とはいえ、これ１つのリクエストをこなすのに、相当お金がかかっているものと思います。致し方がないのでしょう。

加えて、思考中のプロセスが明らかになるのは良いですね。見ていて面白いです。論理的であることと、個性的であることが両立していて参考にもなる気がします。

全体的に主観ですが、
ChatGPT-4o < Claude3.5 < o1
の印象は受けています。

この記事が気に入ったらサポートをしてみませんか？