Claude の Prompt caching の概要
以下の記事が面白かったので、簡単にまとめました。
1. Claude の Prompt caching
「Prompt caching」は、開発者が頻繁に使用するコンテキストをキャッシュできる機能です。「Anthropic API」で利用できるようになりました。これを利用すると、顧客は「Claude」により多くのコンテキストと応答例を提供できると同時に、長プロンプトのコストが最大90%、遅延が最大85%削減できます。キャッシュの有効期間は5分で、キャッシュしたコンテンツが使用されるたびに更新されます。
現在、「Claude 3.5 Sonnet」「Claude 3 Haiku」のパブリックベータ版で利用可能で、「Claude 3 Opus」のサポートは近日中に開始する予定です。
2. Prompt caching に最適なユースケース
「Prompt caching」は、次のような大量のプロンプトコンテキストを一度送信し、その後の要求でその情報を繰り返し参照する必要がある場合に効果的です。
3. Prompt caching の使用例
・本とのチャット (100,000トークンのプロンプト)
・多ショットプロンプト(10,000トークンのプロンプト)
・マルチターン会話(10ターンの会話)
上記のレイテンシは、最初のトークンまでの時間です。
4. Prompt caching の使用料金
「Prompt caching」の使用料金は、キャッシュする入力トークンの数とそのコンテンツの使用頻度に基づいて決まります。キャッシュへの書き込みには基本入力トークン料金より25%高い料金がかかりますが、キャッシュされたコンテンツを使用すると大幅に安くなり、基本入力トークン料金の10%しかかかりません。
5. はじめる
「Anthropic API」の「Prompt caching」のパブリックベータ版の使用を開始するには、ドキュメントと使用料金のページを参照してください。
この記事が気に入ったらサポートをしてみませんか?