概要
- Pro Max 5xプラン での Claude Code 利用時、 クォータの異常な早期消費 を報告
- cache_readトークン が本来より高いレートでカウントされている疑い
- バックグラウンドセッション による予期しないクォータ消費
- 1Mコンテキストウィンドウ による消費加速
- 改善提案 としてトークンカウント方法の明確化や可視化などを提示
Pro Max 5xプランにおけるClaude Codeのクォータ異常消費の詳細
- クォータリセット直後、通常利用(Q&Aや軽度の開発作業)でも 1.5時間でクォータを使い切る現象
- リセット前は 重度の開発作業 (複数ファイル実装やグラフパイプライン、マルチエージェント)で 5時間かけて消費、これは想定内
- cache_readトークン が 本来の1/10レート でなく フルレート でカウントされている疑い
- これにより プロンプトキャッシュのコストメリットが消失、クォータ消費が加速
- 各APIレスポンスのusageオブジェクト からトークン消費を詳細に計測
計測結果の比較
-
ウィンドウ1(15:00-20:00/重度開発)
- APIコール数:2,715
- cache_read:1,044Mトークン
- cache_create:16.8Mトークン
- 入力/出力トークン:8.9k / 1.15M
- ピークコンテキスト:966,078トークン
-
ウィンドウ2(20:00-21:30/通常利用)
- APIコール数:222
- cache_read:23.2Mトークン
- cache_create:1.4Mトークン
- 入力/出力トークン:304 / 91k
- ピークコンテキスト:182,302トークン
-
他のバックグラウンドセッション
- token-analysis:296コール, 57.6M cache_read
- career-ops:173コール, 23.1M cache_read
- 合計:691コール, 103.9M cache_read
問題点の整理
-
cache_readトークンのカウント方法
- 期待値:1/10レートでカウント
- 実際:フルレートでカウントされている模様
- 結果: 数百回のAPIコールで即座にクォータ枯渇
-
バックグラウンドセッションのクォータ消費
- アクティブでないセッションでも 自動コンパクトやフック処理でAPIコールを継続
- ユーザーが操作していなくてもクォータ消費が続く
-
自動コンパクトによる消費スパイク
- コンテキストが上限付近で 自動的に高コストなAPIコールを発生
- ユーザー操作なしで大量トークン消費
-
1Mコンテキストウィンドウの問題
- 1回のAPIコールで最大約96万トークン消費
- cache_readがフルレートカウントならキャッシュの意味が薄れる
再現手順
- Opusモデルで Claude Code を Pro Max 5x プランで起動
- ~/.claude/rules/に 約30ファイル(19kトークン固定オーバーヘッド) を用意
- ツール多用プロジェクト で作業、/contextコマンドでコンテキスト増加を確認
- 200-300回のツールコール後、クォータを確認→大幅に減少
- 他のターミナルで2-3セッションを開いたまま にする
- クォータリセット直後でも、アクティブ利用が少なくても短時間でクォータ枯渇
期待される動作・実際の動作
- cache_readトークン は 1/10レート でカウントされるべき
- バックグラウンド/アイドルセッション はクォータ消費が最小限であるべき
- 自動コンパクト で極端なクォータ消費が起きないこと
- Pro Max 5x は 通常利用で2-3時間以上持続 するべき
- 実際は 1.5時間でクォータ枯渇、 バックグラウンドセッションが78%消費、 cache_readフルレートカウントが疑われる
改善提案・要望
- cache_readのクォータカウント方法を明確化 :公式ドキュメントで明示
- レート制限は実効トークン数で行う :cache_readは1/10レートでカウント
- セッションのアイドル検出 :アイドル状態のセッションはクォータ消費を抑制、または警告表示
- クォータ消費のリアルタイム可視化 :cache_read, cache_create, input, outputごとに分かりやすく表示
- コンテキストサイズからクォータ消費を事前見積もり :操作前に消費予測を提示
まとめ
- クォータ消費速度が異常 で、 cache_readのカウント方法 が主因と考えられる
- バックグラウンドセッション や 自動コンパクト も消費加速要因
- 改善にはトークンカウント方式の見直しと可視化、セッション管理の強化が必須