Anthropicは3月6日にキャッシュTTLを引き下げました

2026年4月12日原文(github.com)

概要

Anthropicが2026年3月初旬に Claude CodeのプロンプトキャッシュTTLデフォルト を 1時間から5分へ変更 したことを示す詳細分析。この変更により キャッシュ作成コストが20–32%増加、サブスクリプションユーザーのクォータ消費も急増。 1時間TTLが本来の意図 だった可能性が高く、3月の変更は サーバーサイド設定の回帰 と推測。コスト・クォータ影響は TTL階層に完全依存、利用量やモデル種別には非依存。 元の1時間TTLへの復帰 または ユーザー設定可能化 を要望。

Claude CodeプロンプトキャッシュTTL変更の経緯と影響

2026年1月11日～4月11日 にかけての Claude CodeセッションJSONLファイル を分析
AnthropicがプロンプトキャッシュのTTLデフォルト を 1時間→5分 にサイレント変更
変更時期は2026年3月6日～8日ごろ、両OS・別アカウントで同一挙動を確認
1時間TTL時代（2月） はキャッシュ再作成コスト・クォータ消費が最小
5分TTL化以降、キャッシュ作成コストが 20～32%増加 し、サブスクユーザーの クォータ消費も急増
キャッシュ作成（write） は キャッシュ読み出し（read） の 12.5倍高額、再作成が多発するとコスト爆発
ロングセッション用途 が多いClaude Codeでは 5分TTL は極端に不利
1時間TTL時代 は ほぼ無駄コストなし （2月は1.1%のみ）、他の月は 15～53%が無駄コスト
サブスクリプションユーザーのクォータ制限到達 も3月以降に初めて発生

フェーズ別TTL挙動

Phase 1（1/11–1/31）: 5分のみ（1時間TTL未実装時期）
Phase 2（2/1–3/5）: 1時間のみ（安定運用、意図的なデフォルトと推測）
Phase 3（3/6–3/7）: 5分トークン再出現、混在開始
Phase 4（3/8–4/11）: 5分TTLが大多数、1時間TTLは少数派または消滅

コスト分析（公式価格適用）

Sonnet/Opus両モデル で TTL階層の違いのみがコスト差を生む
1時間TTL時代（2月） は無駄コストほぼゼロ
5分TTL化以降 は 17.1%（全期間平均） のコスト増
キャッシュ再作成が多発 → キャッシュ読み出しより12.5倍高額

クォータ影響

キャッシュ作成トークン は クォータ消費が大きい
キャッシュ読み出しトークン は消費係数が低い（詳細調査中）
5分TTL化でクォータ制限到達ユーザー急増

根拠と仮説

2月の1時間TTL運用 は 33日間連続で5分トークンゼロ、意図的運用の強い証拠
3月6日以降の急激な5分化 は サーバー設定変更 の可能性が高い
クライアント側・利用パターン・バージョンの変更なし
サーバーサイドのみでTTL階層決定

要望・リクエスト

Anthropicによる公式説明 （TTLデフォルト変更の有無と意図）
Claude CodeのTTLデフォルト方針の明示 （5分が恒久デフォルトか、1時間復帰の予定はあるか）
1時間TTLへの復帰 または ユーザー設定可能化 の検討
キャッシュ読み出しトークンのクォータ消費係数の開示

分析手法

生データ: ~/.claude/projects//*.jsonl（Claude Codeのセッションログ）
抽出条件: type: "assistant" かつ message.usage.cache_creationあり
外部ツール・プロキシ未使用、Claude Code自身のログのみ利用
分析ツール: cnighswonger/claude-code-cache-fix quota-analysis --source mode
価格情報: 2026-04-09時点のAnthropic公式rates.json

Claude Code TTL問題に関する考察と今後の提案

長時間・高文脈セッション を多用するClaude Codeユーザーにとって 5分TTLは不利益
サイレントなサーバー設定変更 はユーザー体験・コスト管理の観点から問題
TTLデフォルトの透明性向上 と ユーザー側でのTTL選択権 が望ましい
クォータ消費ロジックの詳細開示 により、ユーザーが利用計画を立てやすくする配慮も必要

ハクソク