「OpenAI API」で提供されている「モデル」をまとめました。
1. OpenAI API で提供されている モデル
「OpenAI API」で提供されている「モデル」は、次のとおりです。
他にも「OpenAI」は「Point-E」「Whisper」「Jukebox」「CLIP」などのオープンソースモデルも提供しています。
2. o1 ・ o1-mini
応答する前により多くの時間をかけて思考するように訓練されているモデルです。
3. GPT-4o Realtime
WebSocket インターフェースを介してオーディオおよびテキスト入力に応答するモデルです。
4. GPT-4o
「GPT-4」よりも安価で高速な、最も先進的なマルチモーダルフラッグシップモデルです。
5. GPT-4o Audio
オーディオ入力と出力を受け入れるモデルです。
6. GPT-4
「GPT-4」は、GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデルです。
7. GPT-3.5
「GPT-3.5」は、自然言語またはコードを理解して、生成できます。
「gpt-3.5-turbo」はチャット、「gpt-3.5-turbo-instruct」はテキスト生成に最適化されています。
8. DALL-E
「DALL-E」は、自然言語から画像を生成できるモデルです。
9. TTS
「TTS」は、テキストを自然な音声に変換できるモデルです。「tts-1」はリアルタイムのテキスト読み上げ向け、「tts-1-hd」は品質向けに最適化されています。
10. Whisper
「Whisper」は、音声をテキストに変換できるモデルです。多様な音声の大規模なデータセットで学習され、多言語音声認識、音声翻訳、言語識別を実行できるマルチタスクモデルでもあります。「whisper-1」は、オープンソースで提供している「Whisper v2-large」のクラウドサービス版になります。
11. Embedding
「Embedding」は、テキストをベクトル表現に変換できるモデルです。このベクトル表現は、検索、クラスタリング、推奨、異常検出、分類タスクなどで役立ちます。
「text-embedding-3」は、「dimensions」パラメータで、Embeddigがその概念を失うことなく、Embeddingを短縮する (シーケンスの末尾からいくつかの数値を削除する) ことができます。
12. Moderation
「Moderation」は、テキストが機密または安全かどうかを検出できるモデルです。
13. GPT base
「GPT base」は、ファインチューニングで利用可能なベースモデルです。