OpenAI API で提供されているモデルまとめ

2023年11月9日 12:14

「OpenAI API」で提供されている「モデル」をまとめました。

・Model - OpenAI API

1. OpenAI API で提供されているモデル

「OpenAI API」で提供されている「モデル」は、次のとおりです。

・GPT-4o : GPT-4よりも安価で高速な、最も先進的なマルチモーダルフラッグシップモデル
・GPT-4 : GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデル
・GPT-3.5 : GPT-3を改善し、自然言語やコードを理解し、生成できるモデル
・DALL-E : 自然言語から画像を生成および編集できるモデル
・TTS : テキストを自然な音声に変換できるモデル
・Whisper : 音声をテキストに変換できるモデル
・Embedding　: テキストをベクトル表現に変換できるモデル
・Moderation : テキストが機密または安全かどうかを検出できるモデル
・GPT base : ファインチューニングで利用可能なベースモデル

他にも「OpenAI」は「Point-E」「Whisper」「Jukebox」「CLIP」などのオープンソースモデルも提供しています。

2. GPT-4o

「GPT-4」よりも安価で高速な、最も先進的なマルチモーダルフラッグシップモデルです。

・gpt-4o
最新の「GPT-4o」のエイリアス
　・gpt-4o-2024-05-13
　　・コンテキストウィンドウ : 128,000トークン
　　・学習データ : 2023年10月

3. GPT-4

「GPT-4」は、GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデルです。

・gpt-4-turbo
最新の「GPT-4 Turbo」のエイリアス
　・gpt-4-turbo-2024-04-09
　　・コンテキストウィンドウ : 128,000トークン
　　・学習データ : 2023年12月

・gpt-4-turbo-preview
最新の「GPT-4 Turbo - Preview」のエイリアス
　・gpt-4-1106-preview
　・コンテキストウィンドウ : 128,000トークン
　・学習データ : 2023年4月

・gpt-4-vision-preview
最新の「GPT-4 Turbo - Preview」のエイリアス
　・gpt-4-1106-vision-preview
　・コンテキストウィンドウ : 128,000トークン
　・学習データ : 2023年4月

・gpt-4-32k
最新の「GPT-4 32K」のエイリアス
　・gpt-4-32k-0613
　　・コンテキストウィンドウ : 32,768トークン
　　・学習データ : 2021年9月

・gpt-4
最新の「GPT-4」のエイリアス
　・gpt-4-0613
　　・コンテキストウィンドウ : 8,192トークン
　　・学習データ : 2021年9月

4. GPT-3.5

「GPT-3.5」は、自然言語またはコードを理解して、生成できます。
「gpt-3.5-turbo」はチャット、「gpt-3.5-turbo-instruct」はテキスト生成に最適化されています。

・gpt-3.5-turbo
最新の「GPT-3.5 Turbo」のエイリアス
　・gpt-3.5-turbo-1106
　　・コンテキストウィンドウ : 16,385トークン
　　・学習データ : 2021年9月

・gpt-3.5-turbo-16k
・コンテキストウィンドウ : 16,385トークン
・学習データ : 2021年9月

・gpt-3.5-turbo-instruct
・コンテキストウィンドウ : 4,096トークン
・学習データ : 2021年9月

5. DALL-E

「DALL-E」は、自然言語から画像を生成できるモデルです。

・dall-e-3
・dall-e-2

6. TTS

「TTS」は、テキストを自然な音声に変換できるモデルです。「tts-1」はリアルタイムのテキスト読み上げ向け、「tts-1-hd」は品質向けに最適化されています。

・tts-1
・tts-1-hd

7. Whisper

「Whisper」は、音声をテキストに変換できるモデルです。多様な音声の大規模なデータセットで学習され、多言語音声認識、音声翻訳、言語識別を実行できるマルチタスクモデルでもあります。「whisper-1」は、オープンソースで提供している「Whisper v2-large」のクラウドサービス版になります。

・whisper-1

8. Embedding

「Embedding」は、テキストをベクトル表現に変換できるモデルです。このベクトル表現は、検索、クラスタリング、推奨、異常検出、分類タスクなどで役立ちます。

・text-embedding-3-large
　・入力テキスト長 : 8,191
　・出力次元数 : 3,072
・text-embedding-3-small
　・入力テキスト長 : 8,191
　・出力次元数 : 1,536
・text-embedding-ada-002
　・入力テキスト長 : 8,191
・出力次元数 : 1,536

「text-embedding-3」は、「dimensions」パラメータで、Embeddigがその概念を失うことなく、Embeddingを短縮する (シーケンスの末尾からいくつかの数値を削除する) ことができます。

9. Moderation

「Moderation」は、テキストが機密または安全かどうかを検出できるモデルです。「text-moderation-latest」は最新版、「text-moderation-stable」は少し古いモデルになります。

・text-moderation-latest
最新の「Modelation」(text-moderation-007) のエイリアス
・text-moderation-stable
安定版の「Modelation」(text-moderation-007) のエイリアス
　・text-moderation-007 【NEW】
　　・最大テキスト長 : 32,768トークン

10. GPT base

「GPT base」は、ファインチューニングで利用可能なベースモデルです。

・babbage-002
・最大トークン数 : 16,384トークン
・学習データ : 2021年9月
・davinci-002
・最大トークン数 : 16,384トークン
・学習データ : 2021年9月

この記事が気に入ったらサポートをしてみませんか？