見出し画像

GPT-4o miniの画像処理コストは安くない

 [読了目安: 2分]

AI系ポッドキャスト(耳で学ぶAI)を運営している矢野哲平(@robothink_jp)です。この記事では新しく公開されたGPT-4o miniの画像処理にかかるコストについて解説します。

フォーラムで議論されていたコト

OpenAIのフォーラムで議論されていたことが気になりました。

要約すると「GPT-4o miniのコスト安いって言われているけど画像処理に関しては普通に高くない?」というものです。

GPT-4o miniについて補足すると、7月19日に公開された小型の言語モデルです。特徴としてGPT-3.5 Turboより60%以上安く高性能というものです。

確かにテキスト処理のコストは安いです。ただ、詳しく調べてみると画像処理に関してはGPT-4oと変わらないようです。これは盲点...😨

比較

OpenAIのPlaygroundからCompareで比較してみました。

トークンがおよそ33倍

この件は海外でも指摘されていました。

GPT-4o と GPT-4o mini では、画像 1 枚あたりのドル価格は同じです。これを維持するために、GPT-4o mini では画像 1 枚あたりのトークンが多く使用されます。

てっきり私も、GPT-4o mini = 安いと考えていましたが画像が絡むタスクにおいてはその限りではないようですね。
ちなみにOpenAI公式の価格ページに用意されているVision価格の計算機ではGPT-4oとminiの価格は同じだったので確定だと思います。

https://openai.com/api/pricing/

もう1つ気になること

GPT-4o miniの方がレイテンシー遅くない…?🤔
チャット画面上だとGPT-4o miniが速いように見えますがAPIだと遅い?


今後、GPT-4o miniは画像以外にも音声や動画にもマルチモーダルに対応していく予定とあります。音声や動画でも注意して検証したいと思います。
あ、テキストに関して安いことは間違いないのでご安心を✌️

目と耳で学べるAI情報を発信しています

通勤時間に効率良く目と耳でAI情報をインプットできます。

noteでも月に30本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?