「OpenAI API」で提供されている「モデル」をまとめました。
1. OpenAI API で提供されている モデル
「OpenAI API」で提供されている「モデル」は、次のとおりです。
他にも「OpenAI」は「Point-E」「Whisper」「Jukebox」「CLIP」などのオープンソースモデルも提供しています。
2. 継続的なモデルのアップグレード
「gpt-4-turbo-preview」「gpt-4-32k」「gpt-4」「gpt-3.5-turbo」は、最新モデルのエイリアスです。レスポンスには、使用されているモデルのバージョン (例 : gpt-4-0125-preview) が記載されています。
モデル更新後、開発者が少なくとも3か月間使用し続けることができるように、スナップショットのモデルも提供されています。これには、提供終了日も決められています。
3. GPT-4 / GPT-4 Turbo
「GPT-4」は、GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデルです。「gpt-4-1106-preview」「gpt-4-vision-preview 」はOpenAI DevDayで発表された最新モデルのプレビュー版です。
4. GPT-3.5
「GPT-3.5」は、自然言語またはコードを理解して、生成できます。
「gpt-3.5-turbo」はチャット、「gpt-3.5-turbo-instruct」はテキスト生成に最適化されています。
5. DALL-E
「DALL-E」は、自然言語から画像を生成できるモデルです。
6. TTS
「TTS」は、テキストを自然な音声に変換できるモデルです。「tts-1」はリアルタイムのテキスト読み上げ向け、「tts-1-hd」は品質向けに最適化されています。
7. Whisper
「Whisper」は、音声をテキストに変換できるモデルです。多様な音声の大規模なデータセットで学習され、多言語音声認識、音声翻訳、言語識別を実行できるマルチタスクモデルでもあります。「whisper-1」は、オープンソースで提供している「Whisper v2-large」のクラウドサービス版になります。
8. Embedding
「Embedding」は、テキストをベクトル表現に変換できるモデルです。このベクトル表現は、検索、クラスタリング、推奨、異常検出、分類タスクなどで役立ちます。
「text-embedding-3」は、「dimensions」パラメータで、Embeddigがその概念を失うことなく、Embeddingを短縮する (シーケンスの末尾からいくつかの数値を削除する) ことができます。
9. Moderation
「Moderation」は、テキストが機密または安全かどうかを検出できるモデルです。「text-moderation-latest」は最新版、「text-moderation-stable」は少し古いモデルになります。
10. GPT base
「GPT base」は、ファインチューニングで利用可能なベースモデルです。