見出し画像

【gpt-3.5-turboの価格引き下げと新しいモデルの概要】英語解説を日本語で読む【2024年1月26日|@Wes Roth】

gpt-3.5-turboの価格が引き下げられると同時に、バグ修正を含むgpt-4-turbo-previewモデルがリリースされました。テキストモデレーションモデルもアップデートされ、強力なモデレーションが可能になりました。新しいAPI管理ツールにより、開発者はAPIキーの使用状況を理解し、管理することが容易になります。
公開日:2024年1月26日
※動画を再生してから読むのがオススメです。


So, there were just a few big announcements from OpenAI about ChatGPT and the API.

OpenAIからChatGPTとAPIに関するいくつかの重要な発表がありました。

They are launching a new generation of embedding models, new GPT-4 Turbo, and moderation models.

彼らは新しい埋め込みモデルの新世代、新しいGPT-4 Turbo、およびモデレーションモデルを発表しています。

As well as new API usage management tools and soon lower pricing on GPT-3.5 Turbo.

さらに、新しいAPI使用管理ツールとGPT-3.5 Turboの価格引き下げも近々行われます。

And there are some big fixes and improvements in this one.

そして、このバージョンではいくつかの大規模な修正と改善があります。

They're saying, We are releasing new models, reducing prices for GPT-3.5 Turbo, and introducing new ways for developers to manage API keys and new tools to manage API Keys.

彼らは言っています、「私たちは新しいモデルをリリースし、GPT-3.5 Turboの価格を引き下げ、開発者がAPIキーを管理するための新しい方法とツールを導入しています」。

A lot of people have been asking for that.

多くの人々がそれを求めていました。

The new models include two new embedding models, an updated gpt-4-turbo-preview model, an updated gpt-3.5-turbo model, and an updated text moderation model.

新しいモデルには、2つの新しい埋め込みモデル、更新されたGPT-4 Turboプレビューモデル、更新されたGPT-3.5 Turboモデル、および更新されたテキストモデレーションモデルが含まれています。

So, first, they have new embeddings model with lower pricing.

まず、価格が下がった新しい埋め込みモデルがあります。

If you're a developer or a researcher in the machine learning field, this might be a huge deal.

もしもあなたが機械学習の分野で開発者や研究者であるなら、これは大きなニュースかもしれません。

They're saying, We are introducing two new embedding models, a smaller and highly efficient text-embedding-3-small model, and a larger and more powerful text-embedding-3-large model.

彼らは言っています、「私たちは2つの新しい埋め込みモデル、より小さくて高効率なtext-embedding-3-small modelとより大きくてパワフルなtext-embedding-3-large modelを導入しています」。

They give a link to an embedding resource talking about the introduction of text and code embeddings.

彼らは、テキストとコードの埋め込みの導入について語る埋め込みリソースへのリンクを提供しています。

They're saying an embedding is a sequence of numbers that represent the concepts within content, such as natural language or code.

彼らは言っています、埋め込みとは、自然言語やコードなどのコンテンツ内の概念を表す数列です。

Embeddings make it easy for language learning models and other algorithms to understand the relationship between content and to perform tasks like clustering or retrieval.

埋め込みは、大規模言語モデルや他のアルゴリズムがコンテンツとの関係を理解し、クラスタリングや検索などのタスクを実行するのを容易にします。

They power applications like knowledge retrieval in both ChatGPT and the assistance API, and many retrieval augmented generation (RAG) developer tools.

これらはChatGPTやアシスタンスAPIの知識検索などのアプリケーションや、多くの検索増強生成(RAG)開発者ツールに使用されます。

In other words, they take text and the embedding model saves that information as vectors, basically representing complex data like words, sentences, documents, etc., in a way that captures the semantic meaning in a more compact numerical form.

言い換えれば、テキストを取り、埋め込みモデルはその情報をベクトルとして保存し、単語、文、文書などの複雑なデータをよりコンパクトな数値形式で意味的な意味を捉える方法です。

So, humans understand this better, LLMs understand this better.

つまり、人間はこれをより理解しやすく、大規模言語モデルもこれをより理解しやすくします。

Embedding models transform one into the other.

埋め込みモデルは、一方をもう一方に変換します。

So, the small text embedding model, text-embedding-3-small, is our new highly efficient betting model and provides a significant upgrade over the predecessor, which was released in December 2022.

小さなテキスト埋め込みモデルであるtext-embedding-3-smallは、2022年12月にリリースされた前任者よりも大幅にアップグレードされた、非常に効率的なモデルです。

It has stronger performance and reduced price.

性能が向上し、価格が削減されています。

The older models will be available, even though they recommend using the newer ones.

古いモデルは利用可能ですが、新しいモデルの使用を推奨しています。

And the large model, text-embedding-3-large, is our new best performing model, and they're showcasing pretty big results.

そして、大きなモデルであるテキスト埋め込み3 largeは、最も優れたパフォーマンスを発揮する新しいモデルであり、非常に良い結果を示しています。

We might do a full video diving deep into embedding models, but this will be useful for developers and researchers that are dealing with natural language and code tasks like semantic search, cluster during topic modeling, and classification.

私たちは埋め込みモデルについて詳しく説明するフルビデオを作るかもしれませんが、これは自然言語やコードのタスクに取り組んでいる開発者や研究者にとって役立つでしょう。

Also, if you're doing things like sentiment analysis, machine translation, various information retrievals, it seems like these models are much more improved and cheaper and better to use for this.

また、感情分析や機械翻訳、さまざまな情報検索などを行っている場合、これらのモデルはより改良され、より安価で使用するのに適しているようです。

Here's sort of a visualization of the embedding space.

ここに埋め込み空間の可視化があります。

I'll leave a link down in the show description.

詳細は番組の説明欄にリンクを残しておきます。

Basically, the idea is to categorize different, for example, sentences or different meanings of words in clusters for better understanding and retrieval.

基本的には、異なる文や単語の異なる意味をクラスターに分類して、より良い理解と検索を行うというアイデアです。

But let's move on to stuff that I think is going to be more applicable to the general public.

しかし、一般の人々にもっと関連性のある情報に移りましょう。

I'll leave a quick survey down below.

以下に簡単なアンケートを残しておきます。

I'm curious how many people use something like this, how many people are going to be using these text and code embedding models.

私は、このようなものを使用している人の数、これらのテキストとコードの埋め込みモデルを使用する人の数に興味があります。

I'm curious.

私は興味があります。

My guess is it's going to be a few percent of people watching this.

私の予想では、これを見ている人々の数のわずかな割合になるでしょう。

But we have gpt-3.5-turbo model with lower pricing.

しかし、gpt-3.5-turboモデルは価格が下がっています。

So, it looks like input prices are reduced by 50% and output prices are reduced by 25%. So, if you're doing high volume tasks with GPT-3.5 Turbo, that would be quite a substantial savings.

入力価格は50%、出力価格は25%削減されているようです。ですので、GPT-3.5 Turboを使った大量のタスクを行っている場合、かなりの節約になるでしょう。

And the updated gpt-4-turbo-preview, over 70% of requests from GPT-4 API customers have transitioned to GPT-4 Turbo since its release as developers take advantage of its updated knowledge cutoff, larger 128k context windows, and lower prices.

そして、更新されたgpt-4-turbo-previewモデルでは、GPT-4 APIの顧客の70%以上がGPT-4 Turboに移行しており、更新された知識のカットオフ、より大きな128kのコンテキストウィンドウ、そして低価格を活用しています。

So, I believe the previous model is gpt-4-1106-preview.

私は以前のモデルがgpt-4-1106-previewだと思います。

So, today they're releasing an updated gpt-4-turbo-preview model, gpt-4-0125-preview.

ですので、今日彼らは更新されたGPT-4 Turboプレビューモデル、gpt-4-0125-previewをリリースしています。

So, they usually put the date and month of its release in the name of this model.

通常、このモデルの名前にはリリースの日付と月が入ります。

This model completes tasks like code generation more thoroughly than the previous preview model and is intended to reduce cases of laziness where the model doesn't complete a task.

このモデルは、以前のプレビューモデルよりもコード生成などのタスクをより徹底的に行い、タスクを完了しない場合の怠惰なケースを減らすことを意図しています。

The new model also includes the fix for the bug impacting non-English UTF-8 generations.

新しいモデルには、非英語のUTF-8生成に影響を与えるバグの修正も含まれています。

Many people complained about this, and there were even people talking about examples where, depending on what day of the week that GPT-4 thought it was, how much effort it put into generating these code responses seemed to change, which seems bizarre.

多くの人々がこれについて不満を述べ、GPT-4が考える曜日によって、これらのコード応答の生成にかける努力が変わるという例についても話していました。これは奇妙ですね。

But the point is, it could do a lot more.

しかし、ポイントは、それがもっとできるということです。

It just, for some reason, I mean laziness is the perfect word for it, it didn't reach its potential.

何らかの理由で、怠惰という言葉がぴったりですが、それは潜在能力に達しなかったのです。

For those who want to be automatically upgraded to the new gpt-4-turbo-preview versions, we are also introducing a new gpt-4-turbo-preview model named Alias, which will always point to our latest gpt-4-turbo-preview model.

新しいgpt-4-turbo-previewバージョンに自動的にアップグレードされたい方のために、私たちはAliasという名前の新しいgpt-4-turbo-previewモデルを導入しています。これは常に最新のgpt-4-turbo-previewモデルを指すようになります。

So, kind of like a redirect link.

まるでリダイレクトリンクのようなものです。

It sounds like this will just point to whatever is the latest.

これは常に最新のものを指すようです。

We plan to launch GPT-4 Turbo with vision in general availability in the coming months.

私たちは数ヶ月以内にビジョンを持ったGPT-4 Turboを一般提供する予定です。

And we also have an updated moderation model.

そして、更新されたモデレーションモデルもあります。

The free moderation API allows developers to identify potentially harmful text.

無料のモデレーションAPIを使用すると、開発者は潜在的に有害なテキストを特定することができます。

As part of our ongoing safety work, we are releasing text-moderation-007, our most robust moderation model to date.

私たちは安全性に関する取り組みの一環として、最も堅牢なモデレーションモデルであるtext-moderation-007をリリースしています。

You can learn more about building safe AI systems through our safety best practices here.

AIシステムの安全な構築についての詳細は、こちらの安全性のベストプラクティスを通じて学ぶことができます。

And of course, new ways to understand API usage and manage API keys.

もちろん、APIの使用方法を理解し、APIキーを管理するための新しい方法もあります。

This is very useful if you have multiple people on the account or you have multiple different API keys that you're using.

これは、アカウントに複数の人物がいる場合や、複数の異なるAPIキーを使用している場合に非常に便利です。

Many people on Twitter, for example, have asked to have a way to kind of have more granular look into where your API costs are going.

たとえば、Twitterでは、APIのコストがどこに使われているかをもっと詳細に見る方法を求める人が多くいます。

So, for example, here the laundry buddy key is off the charts, which I'm guessing they kind of put that in as a joke.

例えば、ここでは「laundry buddy key」が異常に高いですが、おそらくそれは冗談として入れられたものだと思います。

They're saying, We are launching two platforms improvements to give developers both more visibility into their usage and control over API Keys.

彼らは、「開発者により多くの使用状況の可視化とAPIキーの制御を提供するために、2つのプラットフォームの改善を発表します」と述べています。

First, developers can now assign permissions to API keys from the API Keys page.

まず、開発者はAPIキーの権限をAPIキーのページから割り当てることができます。

For example, a key could be assigned to read-only access to power an internal tracking dashboard or restricted to only access certain endpoints.

例えば、キーを内部のトラッキングダッシュボードの読み取り専用アクセスに割り当てることもできますし、特定のエンドポイントにのみアクセスするように制限することもできます。

So, it sounds like if I am doing an AI tutorial video and one of you see my API key and then, try to use it somewhere.

では、もし私がAIチュートリアルビデオを作成しており、あなたの一人が私のAPIキーを見つけて、それをどこかで使用しようとした場合、どうなるかということですね。

I will be protected.

私は守られます。

Ha!

ははっ!

Second, the usage dashboard and usage export function now expose metrics on an API key level.

2つ目に、使用状況のダッシュボードと使用状況のエクスポート機能は、APIキーのレベルでメトリクスを公開するようになりました。

After turning on tracking, this makes it simple to view usage on a per feature, team, product, or project level simply by having separate API keys for each.

トラッキングをオンにした後、これにより、各機能、チーム、製品、またはプロジェクトのレベルでの使用状況を単純に表示することができます。それぞれのために別々のAPIキーを持つだけで済みます。

And there will be more improvement over the next couple of months.

そして、今後数ヶ月でさらなる改善があります。

And here's kind of what that new screen looks like.

こちらが新しい画面のイメージです。

So, you type in your name if you wanted to for your API key.

ですので、APIキーのために名前を入力します。

And then, you have various restriction options or restricted options models, which capabilities it has access to, whether it has the ability to call an assistant, threads, fine-tuning files, etc.

そして、さまざまな制限オプションや制限オプションモデルがあります。どの機能にアクセスできるか、アシスタントを呼び出す能力があるか、スレッド、微調整ファイルなどです。

As well as a read-only key.

読み取り専用キーもあります。

Once I get a chance to dive into all the stuff, I will give you a further update.

すべての内容を詳しく調べた後、さらなる情報をお伝えします。

Thank you so much for watching.

ご視聴いただき、ありがとうございました。

Make sure you're subscribed.

チャンネル登録をお忘れなく。

My name is Wes Roth and I'll see you next time.

私の名前はウェス・ロスです。次回をお楽しみに。


この記事が気に入ったらサポートをしてみませんか?