OpenAI API で提供されているモデルまとめ

2023年11月9日 12:14

「OpenAI API」で提供されている「モデル」をまとめました。

・Model - OpenAI API

1. OpenAI API で提供されているモデル

「OpenAI API」で提供されている「モデル」は、次のとおりです。

・o1・o1-mini : 応答する前により多くの時間をかけて思考するように訓練されているモデル
・GPT-4o : GPT-4よりも安価で高速な、最も先進的なマルチモーダルフラッグシップモデル
・GPT-4 : GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデル
・GPT-3.5 : GPT-3を改善し、自然言語やコードを理解し、生成できるモデル
・DALL-E : 自然言語から画像を生成および編集できるモデル
・TTS : テキストを自然な音声に変換できるモデル
・Whisper : 音声をテキストに変換できるモデル
・Embedding　: テキストをベクトル表現に変換できるモデル
・Moderation : テキストが機密または安全かどうかを検出できるモデル
・GPT base : ファインチューニングで利用可能なベースモデル

他にも「OpenAI」は「Point-E」「Whisper」「Jukebox」「CLIP」などのオープンソースモデルも提供しています。

2. o1 ・ o1-mini

応答する前により多くの時間をかけて思考するように訓練されているモデルです。

・o1
最新の「o1」のエイリアス
　・o1-2024-12-17
　・コンテキストウィンドウ : 200,000トークン
　・最大出力トークン : 100,000トークン
　・学習データ : 2023年10月

・o1-mini
最新の「o1-mini」のエイリアス
　・o1-mini-2024-09-12
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 65,536トークン
　　・学習データ : 2023年10月

・o1-preview
最新の「o1-preview」のエイリアス
　・o1-preview-2024-09-12
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 32,768トークン　・学習データ : 2023年10月

3. GPT-4o Realtime

WebSocket インターフェースを介してオーディオおよびテキスト入力に応答するモデルです。

・gpt-4o-realtime-preview
最新の「gpt-4o-realtime-preview」のエイリアス
　・gpt-4o-realtime-preview-2024-12-17
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 4,096トークン
　　・学習データ : 2023年10月
　・gpt-4o-realtime-preview-2024-10-01
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 4,096トークン
　　・学習データ : 2023年10月

・gpt-4o-mini-realtime-preview
最新の「gpt-4o-mini-realtime-preview」のエイリアス
　・gpt-4o-mini-realtime-preview-2024-12-17
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 4,096トークン
　　・学習データ : 2023年10月

4. GPT-4o

「GPT-4」よりも安価で高速な、最も先進的なマルチモーダルフラッグシップモデルです。

・gpt-4o
最新の「GPT-4o」のエイリアス
　・gpt-4o-2024-11-20
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 16,384トークン
　　・学習データ : 2023年10月
　・gpt-4o-2024-08-06
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 16,384トークン
　　・学習データ : 2023年10月
　・gpt-4o-2024-05-13
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 4,096 トークン
　　・学習データ : 2023年10月
　・chatgpt-4o-latest
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 16,384トークン
　　・学習データ : 2023年10月
　　※研究と評価を目的

・gpt-4o-mini
最新の「GPT-4o-mini」のエイリアス
　・gpt-4o-mini-2024-07-18
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 16,384トークン
　　・学習データ : 2023年10月

5. GPT-4o Audio

オーディオ入力と出力を受け入れるモデルです。

・gpt-4o-audio-preview
最新の「gpt-4o-audio-preview」のエイリアス
　・gpt-4o-audio-preview-2024-12-17
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 16,384トークン
　　・学習データ : 2023年10月
　・gpt-4o-audio-preview-2024-10-01
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 16,384トークン
　　・学習データ : 2023年10月

6. GPT-4

「GPT-4」は、GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデルです。

・gpt-4-turbo
最新の「GPT-4 Turbo」のエイリアス
　・gpt-4-turbo-2024-04-09
　　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 4,096トークン
　　・学習データ : 2023年12月

・gpt-4-turbo-preview
最新の「GPT-4 Turbo - Preview」のエイリアス
　・gpt-4-1106-preview
　・コンテキストウィンドウ : 128,000トークン
　　・最大出力トークン : 4096トークン
　・学習データ : 2023年4月

・gpt-4
最新の「GPT-4」のエイリアス
　・gpt-4-0613
　　・コンテキストウィンドウ : 8,192トークン
　　・最大出力トークン : 8,192トークン
　　・学習データ : 2021年9月

7. GPT-3.5

「GPT-3.5」は、自然言語またはコードを理解して、生成できます。
「gpt-3.5-turbo」はチャット、「gpt-3.5-turbo-instruct」はテキスト生成に最適化されています。

・gpt-3.5-turbo
最新の「GPT-3.5 Turbo」のエイリアス
　・gpt-3.5-turbo-1106
　　・コンテキストウィンドウ : 16,385トークン
　　・学習データ : 2021年9月

・gpt-3.5-turbo-16k
・コンテキストウィンドウ : 16,385トークン
・学習データ : 2021年9月

・gpt-3.5-turbo-instruct
・コンテキストウィンドウ : 4,096トークン
・学習データ : 2021年9月

8. DALL-E

「DALL-E」は、自然言語から画像を生成できるモデルです。

・dall-e-3
・dall-e-2

9. TTS

「TTS」は、テキストを自然な音声に変換できるモデルです。「tts-1」はリアルタイムのテキスト読み上げ向け、「tts-1-hd」は品質向けに最適化されています。

・tts-1
・tts-1-hd

10. Whisper

「Whisper」は、音声をテキストに変換できるモデルです。多様な音声の大規模なデータセットで学習され、多言語音声認識、音声翻訳、言語識別を実行できるマルチタスクモデルでもあります。「whisper-1」は、オープンソースで提供している「Whisper v2-large」のクラウドサービス版になります。

・whisper-1

11. Embedding

「Embedding」は、テキストをベクトル表現に変換できるモデルです。このベクトル表現は、検索、クラスタリング、推奨、異常検出、分類タスクなどで役立ちます。

・text-embedding-3-large
　・入力テキスト長 : 8,191
　・出力次元数 : 3,072
・text-embedding-3-small
　・入力テキスト長 : 8,191
　・出力次元数 : 1,536
・text-embedding-ada-002
　・入力テキスト長 : 8,191
・出力次元数 : 1,536

「text-embedding-3」は、「dimensions」パラメータで、Embeddigがその概念を失うことなく、Embeddingを短縮する (シーケンスの末尾からいくつかの数値を削除する) ことができます。

12. Moderation

「Moderation」は、テキストが機密または安全かどうかを検出できるモデルです。

・omni-moderation-latest
最新の「omni-moderation」(omni-moderation-2024-09-26) のエイリアス
　・omni-moderation-2024-09-26
　　・最大テキスト長 : 32,768トークン
・text-moderation-latest (レガシー)
最新の「text-moderation」(text-moderation-007) のエイリアス
　・text-moderation-007
　　・最大テキスト長 : 32,768トークン

13. GPT base

「GPT base」は、ファインチューニングで利用可能なベースモデルです。

・babbage-002
・最大トークン数 : 16,384トークン
・学習データ : 2021年9月
・davinci-002
・最大トークン数 : 16,384トークン
・学習データ : 2021年9月