![見出し画像](https://assets.st-note.com/production/uploads/images/128894477/rectangle_large_type_2_55b48595b4f4be9bea8ff71b7288f197.png?width=800)
OpenAI API で提供されている モデル まとめ
「OpenAI API」で提供されている「モデル」をまとめました。
1. OpenAI API で提供されている モデル
「OpenAI API」で提供されている「モデル」は、次のとおりです。
・GPT-4o : GPT-4よりも安価で高速な、最も先進的なマルチモーダルフラッグシップモデル
・GPT-4 : GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデル
・GPT-3.5 : GPT-3を改善し、自然言語やコードを理解し、生成できるモデル
・DALL-E : 自然言語から画像を生成および編集できるモデル
・TTS : テキストを自然な音声に変換できるモデル
・Whisper : 音声をテキストに変換できるモデル
・Embedding : テキストをベクトル表現に変換できるモデル
・Moderation : テキストが機密または安全かどうかを検出できるモデル
・GPT base : ファインチューニングで利用可能なベースモデル
他にも「OpenAI」は「Point-E」「Whisper」「Jukebox」「CLIP」などのオープンソースモデルも提供しています。
2. GPT-4o
「GPT-4」よりも安価で高速な、最も先進的なマルチモーダルフラッグシップモデルです。
・gpt-4o
最新の「GPT-4o」 のエイリアス
・gpt-4o-2024-05-13
・コンテキストウィンドウ : 128,000トークン
・学習データ : 2023年10月
3. GPT-4
「GPT-4」は、GPT-3.5を改善し、自然言語やコードを理解し、生成できるモデルです。
・gpt-4-turbo
最新の「GPT-4 Turbo」 のエイリアス
・gpt-4-turbo-2024-04-09
・コンテキストウィンドウ : 128,000トークン
・学習データ : 2023年12月
・gpt-4-turbo-preview
最新の「GPT-4 Turbo - Preview」 のエイリアス
・gpt-4-1106-preview
・コンテキストウィンドウ : 128,000トークン
・学習データ : 2023年4月
・gpt-4-vision-preview
最新の「GPT-4 Turbo - Preview」のエイリアス
・gpt-4-1106-vision-preview
・コンテキストウィンドウ : 128,000トークン
・学習データ : 2023年4月
・gpt-4-32k
最新の「GPT-4 32K」のエイリアス
・gpt-4-32k-0613
・コンテキストウィンドウ : 32,768トークン
・学習データ : 2021年9月
・gpt-4
最新の「GPT-4」のエイリアス
・gpt-4-0613
・コンテキストウィンドウ : 8,192トークン
・学習データ : 2021年9月
4. GPT-3.5
「GPT-3.5」は、自然言語またはコードを理解して、生成できます。
「gpt-3.5-turbo」はチャット、「gpt-3.5-turbo-instruct」はテキスト生成に最適化されています。
・gpt-3.5-turbo
最新の「GPT-3.5 Turbo」のエイリアス
・gpt-3.5-turbo-1106
・コンテキストウィンドウ : 16,385トークン
・学習データ : 2021年9月
・gpt-3.5-turbo-16k
・コンテキストウィンドウ : 16,385トークン
・学習データ : 2021年9月
・gpt-3.5-turbo-instruct
・コンテキストウィンドウ : 4,096トークン
・学習データ : 2021年9月
5. DALL-E
「DALL-E」は、自然言語から画像を生成できるモデルです。
・dall-e-3
・dall-e-2
6. TTS
「TTS」は、テキストを自然な音声に変換できるモデルです。「tts-1」はリアルタイムのテキスト読み上げ向け、「tts-1-hd」は品質向けに最適化されています。
・tts-1
・tts-1-hd
7. Whisper
「Whisper」は、音声をテキストに変換できるモデルです。多様な音声の大規模なデータセットで学習され、多言語音声認識、音声翻訳、言語識別を実行できるマルチタスクモデルでもあります。「whisper-1」は、オープンソースで提供している「Whisper v2-large」のクラウドサービス版になります。
・whisper-1
8. Embedding
「Embedding」は、テキストをベクトル表現に変換できるモデルです。このベクトル表現は、検索、クラスタリング、推奨、異常検出、分類タスクなどで役立ちます。
・text-embedding-3-large
・入力テキスト長 : 8,191
・出力次元数 : 3,072
・text-embedding-3-small
・入力テキスト長 : 8,191
・出力次元数 : 1,536
・text-embedding-ada-002
・入力テキスト長 : 8,191
・出力次元数 : 1,536
「text-embedding-3」は、「dimensions」パラメータで、Embeddigがその概念を失うことなく、Embeddingを短縮する (シーケンスの末尾からいくつかの数値を削除する) ことができます。
9. Moderation
「Moderation」は、テキストが機密または安全かどうかを検出できるモデルです。「text-moderation-latest」は最新版、「text-moderation-stable」は少し古いモデルになります。
・text-moderation-latest
最新の「Modelation」(text-moderation-007) のエイリアス
・text-moderation-stable
安定版の「Modelation」(text-moderation-007) のエイリアス
・text-moderation-007 【NEW】
・最大テキスト長 : 32,768トークン
10. GPT base
「GPT base」は、ファインチューニングで利用可能なベースモデルです。
・babbage-002
・最大トークン数 : 16,384トークン
・学習データ : 2021年9月
・davinci-002
・最大トークン数 : 16,384トークン
・学習データ : 2021年9月
この記事が気に入ったらサポートをしてみませんか?