プレミアム限定
検証済
Claude APIのプロンプトキャッシュで費用を最大90%削減する方法
AnthropicのPrompt Cachingを活用すると、繰り返し使うシステムプロンプトのコストを大幅に削減できます。実装方法を詳しく解説。
2026年3月27日
Claude APIのプロンプトキャッシュ完全ガイド——コストを最大90%削減する実装方法
Claude APIを実務で使っていると、思いのほかコストが嵩むことがあります。特に、数千トークンのシステムプロンプトや長めのドキュメントを毎回送信する場面だと、請求額が一気に膨れ上がりやすい。
Anthropicが提供する**プロンプトキャッシュ(Prompt Caching)**を正しく使うことで、この問題をかなり根本的に解決できます。実務で試したときもコストが最大90%削減できたので、そのやり方を説明します。
プロンプトキャッシュとは何か
通常のAPI呼び出しだと、送信したすべてのトークンが毎回課金されます。
例えば、5000トークンのシステムプロンプトがあって、ユーザーからの入力が200トークンなら、合計5200トークン分の料金が毎回かかります。
プロンプトキャッシュを使うと、一度処理したコンテンツをサーバーに保存して、2回目以降は「キャッシュ読み取り料金」という格安な額だけになります。5000トークン分が通常の約10%の価格で処理できるようになるから、かなりの削減効果が見込めるわけです。
料金体系の詳細
Claude Sonnet 4.6の場合:
- 通常入力:.00 / 1Mトークン
- キャッシュ書き込み:.75 / 1Mトークン(1.25倍)
- キャッシュ読み取り:.30 / 1Mトークン(0.1倍)
Claude Haiku 4.5の場合:
- 通常入力:.00 / 1Mトークン
- キャッシュ書き込み:.25 / 1Mトークン
- キャッシュ読み取り:.10 / 1Mトークン
キャッシュに書き込むときは少し割高になりますが、2回目以降は90%OFFになります。同じコンテキストを4回以上使うなら、必ずコスト削減が実現します。
キャッシュの保持時間はデフォルト5分で、最大1時間まで設定できます。