概要
Anthropicが2026年3月初旬に Claude CodeのプロンプトキャッシュTTLデフォルト を 1時間から5分へ変更 したことを示す詳細分析。 この変更により キャッシュ作成コストが20–32%増加、サブスクリプションユーザーのクォータ消費も急増。 1時間TTLが本来の意図 だった可能性が高く、3月の変更は サーバーサイド設定の回帰 と推測。 コスト・クォータ影響は TTL階層に完全依存、利用量やモデル種別には非依存。 元の1時間TTLへの復帰 または ユーザー設定可能化 を要望。
Claude CodeプロンプトキャッシュTTL変更の経緯と影響
- 2026年1月11日~4月11日 にかけての Claude CodeセッションJSONLファイル を分析
- AnthropicがプロンプトキャッシュのTTLデフォルト を 1時間→5分 にサイレント変更
- 変更時期は2026年3月6日~8日ごろ、両OS・別アカウントで同一挙動を確認
- 1時間TTL時代(2月) はキャッシュ再作成コスト・クォータ消費が最小
- 5分TTL化以降、キャッシュ作成コストが 20~32%増加 し、サブスクユーザーの クォータ消費も急増
- キャッシュ作成(write) は キャッシュ読み出し(read) の 12.5倍高額、再作成が多発するとコスト爆発
- ロングセッション用途 が多いClaude Codeでは 5分TTL は極端に不利
- 1時間TTL時代 は ほぼ無駄コストなし (2月は1.1%のみ)、他の月は 15~53%が無駄コスト
- サブスクリプションユーザーのクォータ制限到達 も3月以降に初めて発生
フェーズ別TTL挙動
- Phase 1(1/11–1/31): 5分のみ(1時間TTL未実装時期)
- Phase 2(2/1–3/5): 1時間のみ(安定運用、意図的なデフォルトと推測)
- Phase 3(3/6–3/7): 5分トークン再出現、混在開始
- Phase 4(3/8–4/11): 5分TTLが大多数、1時間TTLは少数派または消滅
コスト分析(公式価格適用)
- Sonnet/Opus両モデル で TTL階層の違いのみがコスト差を生む
- 1時間TTL時代(2月) は無駄コストほぼゼロ
- 5分TTL化以降 は 17.1%(全期間平均) のコスト増
- キャッシュ再作成が多発 → キャッシュ読み出しより12.5倍高額
クォータ影響
- キャッシュ作成トークン は クォータ消費が大きい
- キャッシュ読み出しトークン は消費係数が低い(詳細調査中)
- 5分TTL化でクォータ制限到達ユーザー急増
根拠と仮説
- 2月の1時間TTL運用 は 33日間連続で5分トークンゼロ、意図的運用の強い証拠
- 3月6日以降の急激な5分化 は サーバー設定変更 の可能性が高い
- クライアント側・利用パターン・バージョンの変更なし
- サーバーサイドのみでTTL階層決定
要望・リクエスト
- Anthropicによる公式説明 (TTLデフォルト変更の有無と意図)
- Claude CodeのTTLデフォルト方針の明示 (5分が恒久デフォルトか、1時間復帰の予定はあるか)
- 1時間TTLへの復帰 または ユーザー設定可能化 の検討
- キャッシュ読み出しトークンのクォータ消費係数の開示
分析手法
- 生データ: ~/.claude/projects//*.jsonl(Claude Codeのセッションログ)
- 抽出条件: type: "assistant" かつ message.usage.cache_creationあり
- 外部ツール・プロキシ未使用、Claude Code自身のログのみ利用
- 分析ツール: cnighswonger/claude-code-cache-fix quota-analysis --source mode
- 価格情報: 2026-04-09時点のAnthropic公式rates.json
Claude Code TTL問題に関する考察と今後の提案
- 長時間・高文脈セッション を多用するClaude Codeユーザーにとって 5分TTLは不利益
- サイレントなサーバー設定変更 はユーザー体験・コスト管理の観点から問題
- TTLデフォルトの透明性向上 と ユーザー側でのTTL選択権 が望ましい
- クォータ消費ロジックの詳細開示 により、ユーザーが利用計画を立てやすくする配慮も必要