見出し画像

生成AIの進化への企業対応とチェックリスト

生成AIの精度の向上とコストの低下が企業に迫る生成AI関連のシステムの見直しについてお話しします。


生成AIの進化

OpenAIのGPT-4シリーズ以外にもAnthropicのClaude, MetaのLlama、XaiのGrokなど大規模言語モデルの進化には事欠きません。画像や音声や動画の基盤モデルまでいれれば枚挙にいとまがありません。
今回は企業利用の中核になっているテキストの大規模言語モデルに絞ってお話しします。

OpenAIがGPT-4を発表したのが2024年3月です。その後、ずっとGPT-4というネーミングが続いています。しかし、その内容は、GPT-4, GPT-4 Turbo、GPT-4o、GPT-4o miniとすでに4世代になっています。

企業利用のメンバシップクラスの変化(有料、Enterprise、Team)やGPTs を除いても、次の変化が起こっています。

  • 精度の変化

  • APIコストの変化

  • コンテクストウィンドウサイズの変化

精度は改善を続けていますが、今回はAPIコストとコンテクストウィンドウサイズについて変化を見てみます。

APIコストとコンテクストウィンドウサイズ

GPT-4系のAPIコストの変化

GPT-4関連のAPIコストを調べてみました。幸いなことにOpenAIはAPIコストは変更しないポリシーのようです。新しいモデルが出るたびにコストダウンはしますが、古いモデルをそのまま使っているユーザは放置するようです。
以下は、いずれも1Mトークンあたりの米ドルの価格です。左が入力トークンあたり、右が出力トークンあたりのコストです。

GPT-4系のAPIコスト(左 入力、右 出力、1Mトークンあたり米ドル)

1年半の間にコストは200分の1になりました。GPT-4oは2024年5月、GPT-4o miniは2024年7月発表ですから、矢継ぎ早のコストダウンです。

コンテクストウィンドウサイズの変化

コンテクストサイズは2023年11月のGPT-4 Turboから128Kになりました。

GPT-4系のコンテクストウィンドウサイズ

最近は大きな変化はありませんが、Google Gemini 1.5 Proが1M、MagicのLTM-2-miniが100Mなので、OpenAIもどこかでは追従してくると思われます。
コンテクストウィンドウサイズが大幅にかわると企業内で利用する場合、RAG (Retireval Augmented Generation)に使うチャンクサイズの設計に影響します。

環境の変化

ChatGPT

従来、ChatGPTの無料ユーザはGPT-3.5に制限されていましたが、2024年5月からGPT-4oを使えるようになりました。

GPTs

従来、無料ユーザはGPTsの利用ができませんでしたが、2024年5月からGPTsを使えるようになりました。作るのには有料版が必要です。
GPTsは500MBのファイルを20個まで読み込めるので、理論的には10GBまでデータを読み込めます。

企業の判断ポイント

過去1年間の企業の判断ポイントは以下のとおりです:

  • 2023年3月 GPT-4 APIのリリース GPT-4 APIで自社カスタムシステムを作成すべきかどうか

  • 2023年11月 GPT-4 Turboのリリース (1) 自社カスタムシステムとしてのGPTsの適用の可否、(2) 自社カスタムシステムのGPT-4 Turbo 128Kコンテクストウィンドウに基づくRAGのサイズ設定変更の可否、(3) コスト変化による利用戦略の変更の可否

  • 2024年5月 GPT-4oリリース  (1) GPTsの無料ユーザへの開放の影響、(2) コスト変化による利用戦略の変更の可否

  • 2024年7月 GPT-4o miniリリース コスト変化による利用戦略の変更の可否

特にGPT-4o miniは入力で33分の1、出力で25分の1という大幅なコストダウンが発表されました。1個1個のAPIコストが小さくなれば精度を上げるための戦略にも影響します。
最近は半年単位で設計方針の見直しが必要になっています。

チェックリスト

以下は簡単なチェックリストです。

  • 自社のRAGのチャンクサイズは最新のモデルのコンテクストウィンドウを反映しているか

  • APIコスト変化に基づき、開発方針を見直しているか

  • GPT-4oの無料ユーザへの開放は自社の生成AI利用方針と整合しているか

  • 無料ユーザへのGPTs開放は自社の生成AI利用方針と整合しているか

  • APIコスト変化のたびに利用コストの変化を確認しているか

  • 新モデルリリースの時のモデル切り替え判断基準は明確か

  • 新モデルリリース時の旧モデル復旧手順は明確か

  • モデル変更時に変更判断の評価をしているか

むすび

他にもファインチューニングできるモデルの変化、画像生成の変化、音声APIの変化、などがあります。
マルチモーダル系、ファインチューニング系は企業内の最新利用動向に疎いので割愛しました。
ChatGPT無料版で使えるモデルが増えても、次のバージョンアップでさらに高度なモデルが有料版に追加されるかもしれないので、全社的な利用となると朝令暮改にするわけにもいかないので判断は難しいです。
2024年11月のOpenAI DevDayも近づいてきました。OpenAIそしてそれを追撃するGoogle, Meta, Xai, Anthoropicの今後の発表が楽しみです。

参考文献





この記事が気に入ったらサポートをしてみませんか?