見出し画像

OpenAI API で提供されている モデル まとめ

「OpenAI API」で提供されている「モデル」をまとめました。

Model - OpenAI API


1. OpenAI API で提供されている モデル

「OpenAI API」で提供されている「モデル」は、次のとおりです。

・GPT-4 / GPT-4 Turbo : GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデル
・GPT-3.5 : GPT-3を改善し、自然言語やコードを理解し、生成できるモデル
・DALL-E : 自然言語から画像を生成および編集できるモデル
・TTS : テキストを自然な音声に変換できるモデル
・Whisper : 音声をテキストに変換できるモデル
・Embedding : テキストをベクトル表現に変換できるモデル
・Moderation : テキストが機密または安全かどうかを検出できるモデル
・GPT base : ファインチューニングで利用可能なベースモデル

他にも「OpenAI」は「Point-E」「Whisper」「Jukebox」「CLIP」などのオープンソースモデルも提供しています。

2. 継続的なモデルのアップグレード

gpt-4-turbo-preview」「gpt-4-32k」「gpt-4」「gpt-3.5-turbo」は、最新モデルのエイリアスです。レスポンスには、使用されているモデルのバージョン (例 : gpt-4-0125-preview) が記載されています。

モデル更新後、開発者が少なくとも3か月間使用し続けることができるように、スナップショットのモデルも提供されています。これには、提供終了日も決められています。

3. GPT-4 / GPT-4 Turbo

GPT-4」は、GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデルです。「gpt-4-1106-preview」「gpt-4-vision-preview 」はOpenAI DevDayで発表された最新モデルのプレビュー版です。

・gpt-4-turbo-preview (GPT-4 Turbo)
最新の「GPT-4 Turbo」(gpt-4-0125-preview) のエイリアス
 ・gpt-4-0125-preview 【NEW】
  ・コンテキストウィンドウ : 128,000トークン
  ・学習データ : 2023年12月
 ・gpt-4-1106-preview

     ・コンテキストウィンドウ : 128,000トークン
     ・学習データ : 2023年4月

・gpt-4-vision-preview (GPT-4 Turbo with Vision)
    ・コンテキストウィンドウ : 128,000トークン
    ・学習データ : 2023年4月

・gpt-4-32k
最新の「GPT-4 32K」(gpt-4-32k-0613) のエイリアス
 ・gpt-4-32k-0613
  ・コンテキストウィンドウ : 32,768トークン
  ・学習データ : 2021年9月

・gpt-4
最新の「GPT-4」(gpt-4-0613) のエイリアス
 ・gpt-4-0613
  ・コンテキストウィンドウ : 8,192トークン
  ・学習データ : 2021年9月

4. GPT-3.5

GPT-3.5」は、自然言語またはコードを理解して、生成できます。
gpt-3.5-turbo」はチャット、「gpt-3.5-turbo-instruct」はテキスト生成に最適化されています。

・gpt-3.5-turbo
最新の「GPT-3.5 Turbo」(gpt-3.5-turbo-1106) のエイリアス
 ・gpt-3.5-turbo-1106

  ・コンテキストウィンドウ : 16,385トークン
  ・学習データ : 2021年9月

・gpt-3.5-turbo-16k
    ・コンテキストウィンドウ : 16,385トークン
    ・学習データ : 2021年9月

・gpt-3.5-turbo-instruct
    ・コンテキストウィンドウ : 4,096トークン
    ・学習データ : 2021年9月

5. DALL-E

DALL-E」は、自然言語から画像を生成できるモデルです。

・dall-e-3
・dall-e-2

6. TTS

TTS」は、テキストを自然な音声に変換できるモデルです。「tts-1」はリアルタイムのテキスト読み上げ向け、「tts-1-hd」は品質向けに最適化されています。

・tts-1
・tts-1-hd

7. Whisper

Whisper」は、音声をテキストに変換できるモデルです。多様な音声の大規模なデータセットで学習され、多言語音声認識、音声翻訳、言語識別を実行できるマルチタスクモデルでもあります。「whisper-1」は、オープンソースで提供している「Whisper v2-large」のクラウドサービス版になります。

・whisper-1

8. Embedding

Embedding」は、テキストをベクトル表現に変換できるモデルです。このベクトル表現は、検索、クラスタリング、推奨、異常検出、分類タスクなどで役立ちます。

・text-embedding-3-large
 
・入力テキスト長 : 8,191
 ・出力次元数 : 3,072
・text-embedding-3-small
 ・入力テキスト長 : 8,191
 ・出力次元数 : 1,536
・text-embedding-ada-002
 ・入力テキスト長 : 8,191
    
・出力次元数 : 1,536

text-embedding-3」は、「dimensions」パラメータで、Embeddigがその概念を失うことなく、Embeddingを短縮する (シーケンスの末尾からいくつかの数値を削除する) ことができます。

9. Moderation

Moderation」は、テキストが機密または安全かどうかを検出できるモデルです。「text-moderation-latest」は最新版、「text-moderation-stable」は少し古いモデルになります。

・text-moderation-latest
 最新の「Modelation」(text-moderation-007) のエイリアス
・text-moderation-stable
安定版の「Modelation」(text-moderation-007) のエイリアス
 ・text-moderation-007 【NEW】
  ・最大テキスト長 : 32,768トークン

10. GPT base

「GPT base」は、ファインチューニングで利用可能なベースモデルです。

・babbage-002
    ・最大トークン数 : 16,384トークン
    ・学習データ : 2021年9月
・davinci-002
    ・最大トークン数 : 16,384トークン
    ・学習データ : 2021年9月



この記事が気に入ったらサポートをしてみませんか?