世界を動かす技術を、日本語で。

Anthropicは3月6日にキャッシュTTLを引き下げました

2026年4月12日原文(github.com)

概要

Anthropicが2026年3月初旬に Claude CodeのプロンプトキャッシュTTLデフォルト1時間から5分へ変更 したことを示す詳細分析。 この変更により キャッシュ作成コストが20–32%増加、サブスクリプションユーザーのクォータ消費も急増。 1時間TTLが本来の意図 だった可能性が高く、3月の変更は サーバーサイド設定の回帰 と推測。 コスト・クォータ影響は TTL階層に完全依存、利用量やモデル種別には非依存。 元の1時間TTLへの復帰 または ユーザー設定可能化 を要望。

Claude CodeプロンプトキャッシュTTL変更の経緯と影響

  • 2026年1月11日~4月11日 にかけての Claude CodeセッションJSONLファイル を分析
  • AnthropicがプロンプトキャッシュのTTLデフォルト1時間→5分 にサイレント変更
  • 変更時期は2026年3月6日~8日ごろ、両OS・別アカウントで同一挙動を確認
  • 1時間TTL時代(2月) はキャッシュ再作成コスト・クォータ消費が最小
  • 5分TTL化以降、キャッシュ作成コストが 20~32%増加 し、サブスクユーザーの クォータ消費も急増
  • キャッシュ作成(write)キャッシュ読み出し(read)12.5倍高額、再作成が多発するとコスト爆発
  • ロングセッション用途 が多いClaude Codeでは 5分TTL は極端に不利
  • 1時間TTL時代ほぼ無駄コストなし (2月は1.1%のみ)、他の月は 15~53%が無駄コスト
  • サブスクリプションユーザーのクォータ制限到達 も3月以降に初めて発生

フェーズ別TTL挙動

  • Phase 1(1/11–1/31): 5分のみ(1時間TTL未実装時期)
  • Phase 2(2/1–3/5): 1時間のみ(安定運用、意図的なデフォルトと推測)
  • Phase 3(3/6–3/7): 5分トークン再出現、混在開始
  • Phase 4(3/8–4/11): 5分TTLが大多数、1時間TTLは少数派または消滅

コスト分析(公式価格適用)

  • Sonnet/Opus両モデルTTL階層の違いのみがコスト差を生む
  • 1時間TTL時代(2月) は無駄コストほぼゼロ
  • 5分TTL化以降17.1%(全期間平均) のコスト増
  • キャッシュ再作成が多発キャッシュ読み出しより12.5倍高額

クォータ影響

  • キャッシュ作成トークンクォータ消費が大きい
  • キャッシュ読み出しトークン は消費係数が低い(詳細調査中)
  • 5分TTL化でクォータ制限到達ユーザー急増

根拠と仮説

  • 2月の1時間TTL運用33日間連続で5分トークンゼロ、意図的運用の強い証拠
  • 3月6日以降の急激な5分化サーバー設定変更 の可能性が高い
  • クライアント側・利用パターン・バージョンの変更なし
  • サーバーサイドのみでTTL階層決定

要望・リクエスト

  • Anthropicによる公式説明 (TTLデフォルト変更の有無と意図)
  • Claude CodeのTTLデフォルト方針の明示 (5分が恒久デフォルトか、1時間復帰の予定はあるか)
  • 1時間TTLへの復帰 または ユーザー設定可能化 の検討
  • キャッシュ読み出しトークンのクォータ消費係数の開示

分析手法

  • 生データ: ~/.claude/projects//*.jsonl(Claude Codeのセッションログ)
  • 抽出条件: type: "assistant" かつ message.usage.cache_creationあり
  • 外部ツール・プロキシ未使用、Claude Code自身のログのみ利用
  • 分析ツール: cnighswonger/claude-code-cache-fix quota-analysis --source mode
  • 価格情報: 2026-04-09時点のAnthropic公式rates.json

Claude Code TTL問題に関する考察と今後の提案

  • 長時間・高文脈セッション を多用するClaude Codeユーザーにとって 5分TTLは不利益
  • サイレントなサーバー設定変更 はユーザー体験・コスト管理の観点から問題
  • TTLデフォルトの透明性向上ユーザー側でのTTL選択権 が望ましい
  • クォータ消費ロジックの詳細開示 により、ユーザーが利用計画を立てやすくする配慮も必要

Hackerたちの意見

これはAnthropicのピーク時間発表(3月26日)と一致してるね。スロットリングは、TTLのリグレッションによってインフラの負荷が増えたことへの反応の一部かも?

もしそうだったらめっちゃ面白いね。彼らはインフラを「雰囲気」でコーディングして、その負荷に対する反応も「雰囲気」でコーディングしてるってことだ。

タイトル変えた方がいいよ。まるでTTLを1時間から5ヶ月に上げたみたいに見えるし。分のSI記号は「min」だよ、「M」じゃない。OPの表記「m」を使うのが妥協案かな。

同意だわ。最初の反応は「‘M’って何だよ?」だった。

今は全モデルで車洗いの質問に普通に失敗してるし、1ヶ月前はそんなことなかったのに。:-/ 努力セレクターが意図通りに機能してないみたいで、モデルが他の面でもリグレッションしてる。問題が「難しい」って過剰に強調して、解決するのに「時間」がかかるから避ける選択をしてる感じ。人間の努力で引用されることもあるし、ハックやクルージュが多い解決策でも「簡単な」道を提案してる。

すごい、車洗いの質問について知らなかった。ほんとその通りだし、トークンがすごく早く消費される気がする。もっと並列処理ができればその一因かもしれないけど、1ヶ月前の最大プランでは3〜5プロジェクト同時に進められたのに、今は同じOpusモデルで1つも完成できないまま5時間のセッションでロックされちゃう。

「問題がどれだけ『難しい』かを過剰に強調して、解決を避けることを選ぶ」 しばらく前に聞いたんだけど、Claudeが数日間タスクを試みるのを拒否して、「数週間の作業が必要だ」って言ってたんだ。結局、ユーザーが説得して試させたら、30秒で一発で解決したらしい。

ちょっと話がそれるけど、Codexは今めっちゃ素晴らしいよ。1週間前にClaudeから切り替えてからずっと感動してる。

数ヶ月前にこの切り替えをしたけど、ChatGPT 5.4が賢いモデルなのに、最近は5.4でも劣化を感じることが多い。今は使用量がすごく増えてるから、両社でどんな最適化をしてるのか分からない。

Codexは品質的には良いけど、Codexチームのサブスクリプションの制限にすぐにぶつかっちゃって、逆に手間がかかる感じになってる。

Codexに切り替えたいけど、Altmanが完全にサイコパスだし、OpenAIは倫理的なビジネス慣行がまったくないから、良心的にできないんだよね。Anthropicが倫理的だなんて幻想は抱いてないけど、OpenAIよりはマシだと思う。

数週間前にClaudeからCodexに切り替えたよ。エージェントに集中した作業だけさせることにしたら、必要なコンテキストが少なくて済むし、レビューも楽になった。そしたらCodexが同じクオリティを提供できることに気づいたし、トークン単位じゃなくてサブスクリプションで支払えるのもいいね。

Hacker Newsで議論の続きを見る