速いぞ安いぞgpt-3.5-turbo-0613!OpenAI APIアップデート内容
2023年6月13日に、OpenAIが発表したアップデートはかなりのインパクトがありました。APIのアップデートなので開発者以外の方には直接関係ないように思えますが、これでまたさらに素晴らしいプロダクトが誕生するはずですので、全ての方に恩恵があることは間違いありません。
今回のアップデートでリリースされた新しいモデルの中の「gpt-3.5-turbo-0613」を早速使ってみました。
レスポンスの速度は確実に速くなってます。さらに入力コストが1Kトークンあたり0.0015ドルに引き下げられました。(出力コストは0.002ドルのまま)
OpenAIは、TやRと違って開発者を大切にしていることがよくわかります。
今回のアップデートの目玉である「関数呼び出し」については、また今度noteかTwitterで情報を共有したいと思います。
シンプルなチャットアプリをサクッと構築してAPIを試したい場合は、こちらですぐに始められます。
OpenAIが発表したアップデートに関する記事はこちら。
英語の記事を翻訳しながら読むのが面倒くさい、という方のために日本語訳した内容を以下に載せておきます。お役立てください。
本日は、いくつかのエキサイティングなアップデートをお知らせします:
Chat Completions APIに、新しい「関数呼び出し」機能を追加
アップデートされ、より操作しやすくなったgpt-4とgpt-3.5-turbo
gpt-3.5-turboの16Kコンテキストバージョン(標準は4Kバージョン)
最先端の埋め込みモデルのコストを75%削減
gpt-3.5-turboの入力トークンのコストを25%削減
「gpt-3.5-turbo-0301」「gpt-4-0314」モデルの非推奨タイムラインを発表
これらのモデルはすべて、3月1日に導入したのと同じデータプライバシーとセキュリティの保証付きで、リクエストから生成されたすべての出力はお客様のものであり、お客様のAPIデータがトレーニングに使用されることはありません。
関数呼び出し
開発者は、gpt-4-0613とgpt-3.5-turbo-0613に関数を記述し、その関数を呼び出すための引数を含むJSONオブジェクトを出力することをモデルにインテリジェントに選択させることが可能になりました。これは、GPTの機能を外部のツールやAPIとより確実に接続するための新しい方法です。
これらのモデルは、(ユーザーの入力に応じて)関数を呼び出す必要がある場合にそれを検出し、関数の署名に準拠したJSONで応答するように微調整されています。関数を呼び出すことで、開発者はモデルから構造化されたデータをより確実に取得することができます。例えば、開発者は次のようなことができます:
外部ツールを呼び出して質問に答えるチャットボットを作成する(例:ChatGPT Pluginsのようなもの)
「アーニャにメールを送って、来週の金曜日にコーヒーを飲みたいかを確認する」といったクエリを send_email(to: string, body: string) といった関数呼び出しに変換したり、「ボストンの天気はどうですか?」を get_current_weather(location: string, unit: 'celsius' | 'fahrenheit' ) に変換することができます。
自然言語をAPIコールやデータベースクエリに変換する
「今月のトップ10の顧客は誰か?」を get_customers_by_revenue(start_date: string, end_date: string, limit: int) などの内部APIコールに変換したり、「先月のアクメ社の受注件数は何か?」を sql_query(query: string) を使用してSQLクエリに変換することができます。
テキストから構造化データを抽出する
Wikipediaの記事に登場する人物をすべて抽出する関数、extract_people_data(people: [{name: string, birthday: string, location: string}]) を定義する。
これらのユースケースは、/v1/chat/completionsエンドポイントの新しいAPIパラメータ、functionsとfunction_callによって可能になります。開発者向けドキュメントを参照し、関数呼び出しが改善されるケースを発見したら、evalsを追加してください。
ChatGPTプラグインのアルファ版リリース以来、ツールと言語モデルを安全に連携させるための多くのことを学んできました。しかし、まだ未解決の研究課題が残っています。例えば、概念実証の悪用は、ツールの出力から信頼されていないデータが、モデルに意図しないアクションを指示することを説明しています。私たちは、これらのリスクやその他のリスクを軽減するために取り組んでいます。開発者は、信頼できるツールからの情報のみを消費し、電子メールの送信、オンライン投稿、購入など、実世界に影響を与えるアクションを実行する前に、ユーザー確認の手順を含めることで、アプリケーションを保護することができます。
新しいモデル
GPT-4
gpt-4-0613は、関数呼び出しのあるアップデートされた改良型モデルを含んでいます。
gpt-4-32k-0613は、gpt-4-0613と同様の改良を加え、より大きなテキストの理解度を高めるために文脈の長さを延長しました。
これらのアップデートにより、今後数週間で、ウェイティングリストの多くの方々にGPT-4をお試しいただき、このモデルでウェイティングリストを完全に削除することを目指します。あなたがGPT-4で何を作るか、楽しみにしています!
GPT-3.5 Turbo
gpt-3.5-turbo-0613は、GPT-4と同様の関数呼び出しと、システムメッセージによるより確実な操縦性を備えており、開発者はモデルの応答をより効果的に誘導することができます。
gpt-3.5-turbo-16kは、gpt-3.5-turboの4倍のコンテキスト長を2倍の価格で提供します:1K入力トークンあたり0.003ドル、1K出力トークンあたり0.004ドルです。16kのコンテキストは、このモデルが1回のリクエストで20ページ程度のテキストをサポートできるようになったことを意味します。
モデルの廃止
本日より、3月に発表したgpt-4とgpt-3.5-turboの初期バージョンのバージョンアップと非推奨化プロセスを開始します。安定したモデル名(gpt-3.5-turbo、gpt-4、gpt-4-32k)を使用しているアプリケーションは、6月27日に自動的に上記の新モデルにアップグレードされます。バージョン間のモデル性能を比較するために、Evalsライブラリは、モデルの変更がユースケースに与える影響を示すパブリックevalおよびプライベートevalをサポートしています。
移行に時間を要する開発者は、APIリクエストの「model」パラメータにgpt-3.5-turbo-0301、gpt-4-0314、gpt-4-32k-0314を指定して、旧モデルを引き続き使用できます。これらの旧モデルへのアクセスは9月13日までで、それ以降は、これらのモデル名を指定したリクエストは失敗します。モデルの非推奨化に関する最新情報は、モデルの非推奨化ページでご確認ください。これは、これらのモデルに対する最初のアップデートです。したがって、スムーズな移行を確実にするために、開発者のフィードバックを熱烈に歓迎します。
低価格設定
私たちは、システムの効率化を進め、その節約分を今日から開発者に還元しています。
Embeddings
text-embedding-ada-002は、私たちの最も人気のある埋め込みモデルです。本日、コストを75%削減し、1Kトークンあたり0.0001ドルにしました。
GPT-3.5 Turbo
gpt-3.5-turboは、私たちの最も人気のあるチャットモデルで、数百万人のユーザーのためにChatGPTを駆動しています。今日、私たちはgpt-3.5-turboの入力トークンのコストを25%削減しました。開発者はこのモデルを、1K入力トークンあたり0.0015ドル、1K出力トークンあたり0.002ドルで使用できるようになりました。これは、1ドルあたり約700ページに相当します。
gpt-3.5-turbo-16kの価格は、1K入力トークンあたり0.003ドル、1K出力トークンあたり0.004ドルとなります。
この記事が気に入ったらサポートをしてみませんか?