世界を動かす技術を、日本語で。

「Claude Code」ユーザーが使用制限に「予想以上に早く」達している

概要

  • Anthropic社のClaude Code でトークン消費量の急増とクォータ枯渇が発生
  • 利用者が予定より早く制限に達し 作業に支障
  • バグや仕様変更、プロモーション終了 などが影響
  • キャッシュ設定や料金体系の不透明さ も問題
  • Google Antigravityでも類似問題 が報告

Claude Codeのトークン消費問題と利用者の不満

  • AnthropicのAIコーディングアシスタントClaude Code で、 トークン使用量が急増 し、クォータ(利用上限)枯渇が頻発
  • Anthropic公式 が「予想より早く利用制限に達している」と認め、 最優先で調査中 と発表
  • Claude Pro(年200ドル)利用者 がDiscordで「毎週月曜に上限に達し、土曜にリセット。30日中12日しか使えない」と不満表明
  • RedditのAnthropicフォーラム にも苦情が殺到
  • Max 5プラン(月100ドル)利用者 は「以前は8時間作業できたが、今は1時間で上限到達」と証言

トークン消費増加の要因

  • ピーク時のクォータ削減 をAnthropicが発表。エンジニアのThariq Shihipar氏によれば、全体の約7%が影響
  • 効率化の実施 も同時にアナウンス
  • 3月28日でプロモーション終了。ピーク外での利用上限が2倍だったキャンペーンが終わる
  • Claude Codeのバグ疑惑。ユーザーが「プロンプトキャッシュが壊れるバグで10〜20倍のコスト増」と指摘
    • 旧バージョン(2.1.34)へダウングレード で改善したとの報告も複数
  • プロンプトキャッシュの仕様。キャッシュは「繰り返し処理の時間とコストを大幅削減」と説明されているが、 有効期間は5分 のみ
    • 短時間離席でもキャッシュ切れ でコスト増加
    • キャッシュ有効期間を1時間に延長可能 だが、書き込みトークン価格は通常の2倍
    • キャッシュ読み込みトークンは基準価格の0.1倍 で、コスト最適化の重要ポイント

料金体系と利用制限の不透明さ

  • Anthropicは具体的な利用制限を明示していない
    • Proプランは「無料サービスの5倍以上の利用」 とだけ案内
    • Standard Teamプランは「Proプランの1.25倍」 と説明
    • 実際の利用上限はダッシュボードで確認 するしかない状況

類似事例と業界全体の課題

  • Google Antigravityのユーザーも同様の問題 を今月初めに報告
  • AI開発における価格・利用モデルの調整 という根本課題
    • ユーザーはコスト管理を求め、プロバイダーは利益確保が必要
  • ベンダーのマーケティングと現実のギャップ
    • AIの自動化やワークフロー組み込みを推奨 しつつ、クォータ制限でツール停止リスク
    • 自動化ワークフロー利用者はレートリミットエラーに注意。通常の失敗と見分けづらく、リトライで一気にクォータ消費するリスク

今後の対応と最適化ポイント

  • Anthropicの調査・対応に期待
  • ユーザー側でのキャッシュ設定やバージョン管理によるコスト最適化
  • 利用状況のダッシュボード監視とレートリミットエラーの明示的なハンドリング
  • AIサービス全体の料金体系と透明性向上への要望強化

Hackerたちの意見

昨日、プロプランで小さな会話を一回やったんだけど、Claudeが3回のウェブ検索をしたり、ウェブ検索なしの小さな会話をしたり、既存の長い会話に一つのプロンプトを追加したりしたんだ。最後のプロンプトの後に、なんか気づいたら午後5時までの制限に達してたのにはびっくりした。このアカウントはIDEやコードに繋がってないから、すごく混乱する。

ツールコール(特にコンテキストを取得するやつ)は、コンテキストウィンドウをかなり食うね。MCPコールをサブエージェントに明示的に送るのは、彼らがすごく「言葉が多い」からなんだ。

先月、プロプランをキャンセルしたよ。Claudeを日常的に使ってたんだ。実際、APIプランも使ってて、さらに$20追加してたから、毎月約$40くらいだった。去年の12月からこんな感じで、セッションが数時間続いて、深いボイラープレートやデータベースクエリからアーキテクチャの議論やツール選定までやってたのに、ここ2ヶ月はどんどん短くなってきた。一つのプロンプトと、これがなぜであれ、あれがなぜであれっていう少しの議論で終わっちゃう。

OpenCodeがClaudeの統合を強制的に外して、トークンの消費がひどくなった後、私もサブスクリプションをキャンセルした。

私も全く同じ体験をしたよ(価格とかが超不気味だった)。今は基本的な問題にしかクラウドのサブスクリプションを使えない気がしてきた。範囲不安が出てきてる。

Claudeのコードはトークンをめちゃくちゃ消費すると思う。論文が自信満々にコンテキストの劣化は問題ないって言っても、出力の質を保つためにはコンテキストをキュレーションするのがすごく重要だと感じる。ClaudeのWebUIでこれを手動で管理することで、自由にClaudeのコードを投げるよりも、私のユースケースには役立ってる。多分、私の使い方は「間違ってる」かもしれないけど、私にはその使い方の方が理解しやすくて、コンテキストの劣化を最小限に抑えられる。

これ、バグだったみたい。https://x.com/om_patel5/status/2038754906715066444?s=20 あるredditユーザーがバイナリをリバースエンジニアリングして、キャッシュ無効化の問題だとわかったんだ。もしClaudeのコードの会話が請求やトークンについて話すと、隠れた文字列の置き換えをしてるみたい。それがその時点でキャッシュを無効にするみたい。会話履歴のどこかにその文字列が出てくると、最初のテキストが置き換えられて、キャッシュ全体が最初から再構築されると思う。だから、特に悪意があるわけじゃなくて、ただのバグだね。

数日前、Claudeがエラー500を出してた時、リトライは全然成功しなかったけど、手動でキャンセルしてリトライすると大体うまくいったよ。

何も悪意はないけど、Anthropicはユーザーにクレジットを与えてるの? ある意味、これは顧客からの盗みみたいなもんだよね。もし彼らが受け取ってないものに対してお金を払ってたら。

そのバグは、その魔法の文字列が言及されている会話にしか影響しないはずだから、そんなに一般的ではないはず。

https://xcancel.com/om_patel5/status/2038754906715066444

これは https://old.reddit.com/r/ClaudeAI/comments/1s7mkn3/psa_claud... の要約と画像だね。

君がリンクしたバグは、再開後の最初のリクエストにおける最悪のケースの選り抜きだよ。修正すべきだけど、みんなが文句言ってる使用問題とは違うと思う。

バグ2: --resumeを使うたびに、会話のキャッシュが最初から再構築される。大きな会話での1回の再開は$0.15かかるけど、実際はほぼゼロで済むはず。APIキーを使ってるから、/costが使えるんだけど、再開したときに最初の時のコストが表示されたんだ。APIキーとサブスクリプションの違いが明確じゃないと思うけど、単に再開しただけで$5もかかるの? UIは本当にそれが元々の$5だったように見える。

こういうプラットフォームには変な「トークン不安」があるよね。いつどれだけの「制限」を消費するかわからないし、そもそもその「制限」が何なのか、どう計算されてるのかもわからない。今のところ、人々はAnthropicが親切にしてくれて、使い切れないほどの量をくれるだろうって思ってるみたい。

これ、携帯電話の初期の頃を思い出させるね。どこにでも制限があって、キロバイト単位でお金を払ってた。確か、テキストメッセージ1通に45セント払ってた時期もあった。これが良くなって、ギガワットのデータセンターが必要なくなることを願ってる。

そうだね、オープンコードのパッチをいくつか調整して、コーデックスの使用制限がどこにあるかを確認してる。1ヶ月前までは、その情報がChatGPTのウェブUIで見えなかったんだ。突然AIに追い出されるまで作業を続けて、どれくらいの時間や日数待たなきゃいけないのか考え込む。こんな体験が全然OKだなんて信じられないし、受け入れられているのが驚きだよ。

最近、制限がどれだけ早く消費されるかに気づいて、redditで同じ問題についての他の人の不満を読んでいたら、これがどれだけ実際のエラーやバグなのか、どれだけがアカウントをキャンセルせずにどの程度の制限が許容されるかをテストしているのか気になってきた。結局、「やばい状況」になったときには、手を振って謝罪(またはしない)することで、抽象的な「バグ」のせいにできる。これに関する透明性や責任の欠如は、私には信じられないほどだ。

これは、小売業の動的価格設定と同じような感じがする。商品じゃなくてコンピュータに適用されてるだけで。何を得ているのか本当にわからないし、ルールも変わる。さらに厄介なのは透明性の欠如。明確で厳格な制限があれば、人々はそれに基づいて計画できるのに。今は動くターゲットみたいで、実際の作業に信頼を置くのが不可能になってる。いつの間にかバグって感じじゃなくなって、ユーザーに対する価格実験みたいに感じ始める。

サブスクリプションを払ったのに、トークンの制限が広告より少なかったら、返金してくれるの? どこかに小さな文字があって、訴えたりクレジットカードでお金を引き戻すのを防いでるのかな?

Claudeを抽象レイヤーとして使うことに慣れると、結構無茶をするようになるよね。うちの組織には「プレミアムモデル」って概念があって、毎月制限がリセットされる。先月は、過去に単純なbashループで済んだことにトークンを使いまくって、すぐに制限に達しちゃった。すべては、すべての自動化ニーズをチャットレイヤーでClaudeに接続することに慣れすぎて、もう考えなくなってたから。

これに遭遇したことがあるけど、私が特別なユーザーだとは思えないな。作業の合間に遅延があったり、一度に多くを動かしていなかったり、小さなコードベースでやってるんだけど、さっきクォータに達しちゃった。過去にはもっと多くの作業をしてもクォータに引っかからなかったのに。数日前にサポートに詳細や懸念、彼らの社員のツイッタースレッドへのリンク、具体的なサポートリクエストを送ったんだけど、AIエージェントの「Fin」がこう言ったんだ: > 「サポートチームは手動でリセットしたり、使用制限を回避することはできませんが、ベストプラクティスについてはこちらで学べます。メッセージ制限に達した場合は、リセット時間まで待つ必要があります。または、アップグレードプランを購入することを検討してください(該当する場合)。」私はそれが適切な回答じゃないと言った。透明性や責任感が欠けているのは本当にその通り。アンソロピックは、OpenAIよりも倫理的なスタンスを持っているように見えて、良い製品を提供しているけど、顧客への扱いがひどくてすぐに台無しにしちゃう。バグがあるなら解決すべきだし、その間はクォータを返金すべきだよ。「できない」って、驚きだね。これはシンプルで合理的なこと。基本的なカスタマーサービスだと思う。彼らが自分たちの態度がどれだけのダメージを与えているか気づいているかは分からないけど。

無料の$50の追加使用クレジットや、推論が非常に遅い特定の時間帯以外での2倍の使用など、実験を続けているね。これがすべて、徐々にフロッグを煮る実験のように思えてしまう。

クロードにはトークンを少なくカウントするバグがあったんじゃないかな、それを修正したみたい。

意図通りに動いてるの? 彼らは、制限に達する速さは多くの要因(あなたが知らないこと)やシステムの現在の負荷によるってオープンに言ってるよ。単に利用が増えたのかもしれないね。

この価格モデルでは、最も価値のあるアカウントはあまり使われていないものだってのが面白いよね。だから制限に直面しない。ヘビーユーザーがフラストレーションでアカウントをキャンセルするのは、アンスロピックにとっては短期的には勝ちだよね。

たくさんの人がほぼ攻撃的にプロ・クロードだと思う。彼らは他のプロバイダーやエージェントを考慮せず、最新のオーパス以外のモデルを使おうとしない。よく聞く理由は、1) 最高のモデル以外は使いたくない、他のものは時間の無駄だと思っている、2) 自分の経験から、他のどれよりも遥かに良いと信じているってこと。たとえ他のモデルが同じくらい良い、あるいはそれ以上だというベンチマークを見せても、使おうとしない。私の疑いは、彼らがオーパスが最高だと自分に言い聞かせているってこと。評判や価格のせいでね。別のモデルを使ったことがあって、良い経験ができなかったから、さらに固執しているのかも。研究機関が実験を行ってくれることを願ってる。私の仮説は、似たような最先端モデルをいくつか入れ替えたら、モデルの「クラス」を変えても(ソネットオーパス、GPT 5.4 ソネットなど)、ユーザーはどれがどれか分からないってこと。これが、体験が主観的であり、彼らの決定が合理性ではなくバイアスによって影響されていることを示すと思う。ワインテイスティングの実験みたいなもので、人々は$100のワインを$10のワインよりも高く評価する。でも、実際に味が同じなら、$10のワインを買うべきなのに。人々は$100のワインが良いと信じているから、そうしないんだ。AIの場合、問題は人々が高いボトルを買い続けること。彼らは自分たちが高いボトルを使わなければならないと信じ込んでいるから。

これが私の経験でもある。クロードとキミの違いが分からない。

アンスロピックは常にルールを変えて、予期せぬことをしてる感じがする。彼らが無能なのか、ただ不注意なのかは分からないけど、これが理由でしばらく前に彼らにお金を払うのをやめたんだ。自分の頭を使う方がずっと面白くて楽しいよ。

彼らがずっと赤字で、運営費を投資に頼ってる限り、持続可能なビジネスモデルを探して右往左往することになるだろうし、それについては責められないよね。

考慮すべき点: - アンスロピックがトークンの価値を決める。 - ユーザーは、特定のレスポンスがどれだけのトークンを消費するかを見たり、コントロールしたりできない。これが唯一の予想される答えだよね。 https://forstarters.substack.com/p/for-starters-59-on-credit...

そうだね、マックスプランの非定常使用で制限に引っかかるのはクレイジーだよね。