見出し画像

【ChatGPT】新モデル"o1"がリリース。特徴は「推論」と「コーディング」(追記:評価記事4件へのリンク)


はじめに

OpenAIの新しい大規模言語モデルが2つリリースされました。
各名称は、o1-previewとo1-miniです。

モデルを切り替えて使用可能

OpenAIからのEメールによる説明

(日本語訳)
こんにちは。
本日、私たちは新しいモデルシリーズ、OpenAI o1 を発表しました。これらのモデルは、反応する前に考える時間を長く取れるように開発されました。これらのモデルは、複雑なタスクを推論し、科学、コーディング、数学の以前のモデルよりも難しい問題を解決することができます。詳細については、ブログ投稿をご覧ください。
ChatGPT Plusで o1 ベータ版を試すことができます。2 つのモデルを展開しています:強力な推論能力と幅広い世界知識を備えた、当社の大規模モデル o1-preview。
当社の小型モデル o1-mini は、コーディング タスクでは o1-preview よりも高速で競争力があります (パフォーマンスについては、こちら をご覧ください)。
これらのモデルは、この短いベータ期間中は、あなたのアカウントの API では利用できません。(使用レベル 5の開発者はアクセスできますが、アクセスを他のレベルに拡大する予定です。) 私たちは o1 の改善を続けています。API で利用できるようになりましたら、すぐにご連絡いたします。
よろしくお願いします。OpenAI
チーム

2つのモデルのポイント

ポイントは以下の通りです。

  • o1-preview:強力な推論能力と幅広い世界知識を持つ大規模モデル。

  • o1-mini:コーディングタスクで高速かつ競争力のある小型モデル。

これから両方について試した結果をこのnoteで書いていきます。

o1-previewの注目点

o1-previewについては、推論能力をアップしていることで、論理パズルや数学の問題を解かせます。
昨年GPT-4で試した際は、論理的問題はほぼ0点で、むちゃくちゃな回答でした。大規模言語モデルの仕組みからして仕方がないのですが、明らかに論理的問題は処理できていませんでした。
今回論理問題を適切に処理できるか、いろいろな論理問題を与えて試したいと思います。

もし、論理問題が適切に処理できたら、本当にすごいことです。

アップデート:o1-previewに関する評価記事(2件)

o1-mininの注目点

o1-miniについては、OpenAIからのメールに面白いことが書いてありましたね。
”コーディング タスクでは o1-preview よりも高速で競争力があります”という記述です。

ChatGPTのコーディング能力については、以下のようなGPTsを作成し、その都度必要な小型Webアプリを作って日常業務に使用しているので、コーディング能力がどの程度向上したか興味津々です。

余談ですが、簡単なWebアプリでも、業者に依頼すると数週間、数十万円かかりますが、GPTで出力すれば、1分で作れます。
カスタマイズも人間に依頼するとまたそこで数十万円ですが、追加費用を気にせず自由にカスタマイズやバージョンアップできる点も魅力です。

以前、GPT-4からGPT-4oにモデルがアップグレードした際に、コーディング能力がかなり向上し、出力されたコードのエラー発生率が激減した経験があるので、今回も同様に期待しています。

今後、これらの新モデルのAPIが開放され、Cursorなどのプロジェクト全体を管理できるAIコーディングエディタで使えるようになると、更にプログラマーの生産性が上がります。

アップデート:o1-miniに関する評価記事(2件)

まとめ

今回の新モデルは、コードネーム「Strawberry」と呼ばれ、NSAに予めプレゼンテーションされていたモデルを指すのかもしれません。

いずれにせよ、新モデルの推論能力とコーディング能力、どちらも期待大です。

【重版決定】AIアプリをプログラミング不要で開発する書籍

GPTsを自分で作って世界に公開したい方はこちら!

この記事が気に入ったらサポートをしてみませんか?