世界を動かす技術を、日本語で。

Claude Sonnet 4は1Mトークンのコンテキストをサポートしました

概要

Claude Sonnet 4最大100万トークン の長文コンテキストをAnthropic APIでサポート開始 従来比5倍 の拡大により、大規模コードベースや複数文書の一括処理が可能 Amazon Bedrock で利用可能、 Google Cloud Vertex AI も近日対応予定 価格体系 は20万トークン超で調整、バッチ処理やキャッシュでコスト削減も可能 Bolt.newiGent AI など、実際の導入事例も紹介

Claude Sonnet 4の1Mトークン長文コンテキスト対応

  • 最大100万トークン のコンテキストウィンドウをAnthropic APIで公開ベータ提供
  • 従来比5倍 の拡大により、7万5千行以上のコードや数十本の論文も一度に処理可能
  • Amazon Bedrock で利用可能、 Google Cloud Vertex AI も近日対応予定
  • 長文コンテキストの活用で、より多様かつ高度なユースケースに対応

長文コンテキストによる主なユースケース

  • 大規模コード解析

    • ソースコード、テスト、ドキュメント等、プロジェクト全体を一括ロード
    • アーキテクチャ理解、ファイル間依存解析、システム設計全体を考慮した改善提案
  • 文書統合・要約

    • 契約書、論文、技術仕様書など大量文書の一括処理
    • 数百文書間の関係性分析やコンテキスト保持
  • コンテキスト対応エージェント

    • 複数ツール呼び出しやマルチステップワークフローにおける一貫性維持
    • APIドキュメント、ツール定義、やりとり履歴も完全保持

API価格体系とコスト削減方法

  • 200Kトークン以下

    • 入力: $3/百万トークン
    • 出力: $15/百万トークン
  • 200Kトークン超

    • 入力: $6/百万トークン
    • 出力: $22.5/百万トークン
  • バッチ処理プロンプトキャッシュ の活用で 最大50%のコスト削減 可能

顧客導入事例

  • Bolt.new

    • Claudeを統合したブラウザベース開発プラットフォーム
    • 「1Mコンテキストで大規模プロジェクトにも高精度を維持」とCEOのEric Simons氏
  • iGent AI

    • MaestroというAIパートナーで会話から実行可能なコード生成を実現
    • 「1Mトークン対応で自律型エージェントの生産規模開発が可能に」とCEOのSean Ward氏

利用開始方法と今後の展開

  • Anthropic API のTier 4またはカスタムレートリミット顧客向けに公開ベータ提供
  • Amazon Bedrock で利用可能、 Google Cloud Vertex AI も近日対応予定
  • その他Claude製品への展開も検討中
  • 詳細は 公式ドキュメント および 価格ページ 参照

Hackerたちの意見

これを選択肢として持つのは確かにいいけど、同時にもっとコンテキストがあると出力の質が下がる気がする。LLMが「気を散らされやすく」なるからね。だから、ユーザーがトレードオフをちゃんと理解してないと、Claude Codeみたいなツールが生成するコードの質がどうなるのか気になるな。自動モードでコーディングして、自動コンパクトまで放置したらどうなるんだろう。

じゃあ、代わりに何をすればいいと思う?Claude Codeを結構使ってるけど、これに関するベストプラクティスはまだまだ初心者なんだよね。

参考までに: https://simonwillison.net/2025/Jun/29/how-to-fix-your-contex... https://www.dbreunig.com/2025/06/22/how-contexts-fail-and-ho...

現時点ではClaude Codeには統合されてないよ。「他のClaude製品に長いコンテキストをどう持ってくるかも検討中です」とのこと。彼らはこの問題についてすでに知っていて、ユーザーが月額プランで余計なコストをかけないように解決策を考えてるんだと思う。

Claude Codeでそれが有効か設定できるかについて言及してないのが不思議だね。

うん、同じく、これについて気になるな。Claude Codeではデフォルトで有効になってるんじゃないかな。

彼らははっきりとは言ってないけど、まだClaude Codeにはないと思う。 >「他のClaude製品に長いコンテキストを持たせる方法も探っています。」 - Anthropic つまり、Anthropic API tier 4やAmazon Bedrock以外の製品のことね。

コマーケティングの観点から言うと、パートナーの製品と同じカテゴリや似たようなカテゴリの自社製品について話すのは避けるのがベストプラクティスとされてる。今週中に発表する可能性が高いけど、もしかしたらClaude Codeのアップデート時に見る「新着情報」の中でだけかもしれないね。

これは確かに「プロフェッショナルなソフトウェアエンジニアリング」のために使ってる僕のCOREな問題の一つだ。LLMには非常に効果的なコンテキストを維持してほしいし、日常的には次のモデルが少し良くなるだけじゃあまり面白くないんだよね。でも、価格が全てだから。コンテキストウィンドウに自分のコードベースを詰め込めるのは素晴らしいけど、価格が大幅に上がったことを考えると、現状に合わせてコンテキストウィンドウをうまく管理するのが理にかなってる。彼らのコンテキストウィンドウを埋めることで得られる価値は素晴らしいけど、Sonnetがどれだけ効果的に軌道を保っているかを評価する方法がないと、実際に価値があるのかは不明だね。

コンテキストを埋めることは、LLMが自分を混乱させる可能性を高めることにもなる。主に長いコンテキストのせいで、リセットなしで道を外れちゃうからね。

ここで実際に価値があるかどうかははっきりしない。最近、Claude Codeに数週間取り組んでみた結果、エージェントAIから得られる純粋な価値は実際にはマイナスだと結論づけた。ただ、6〜8ヶ月後にもう一度試してみるつもり。

どうやってやるのか分からないけど、もしかしたら一部のコーディングエージェントがやってるかもしれない。AIには全体のコードベースを使うんじゃなくて、抽象化を使うことを教えないといけない。人間は全てのコードベースを頭に入れてるわけじゃないし、AIにもそれを期待すべきじゃないよね。

LLMには非常に効果的なコンテキストを維持してほしい。実際にこれを作ったんだけど、「ツールを使え」とはまだ言えない。でも、詳細はここで見られるよ: https://github.com/gitsense/chat。デモリンクはまだ準備中で、管理ツールを最終調整中なんだ。ただ、npmの指示に従って遊ぶことはできるはず。基本的なアイデアは、全てのリポジトリを読み込んで、コンテキストビルダーを使ってそれを洗練させることができるってこと。あるいは、カスタムアナライザーを作って「AIアシスト」で検索できるようにすることもできる。例えば、!ask find all frontend code that does [this]を実行すると、アナライザーがそのクエリをサポートする正しいメタデータを抽出する方法を知ってるから、簡単にコンテキストを構築できるよ。

厳しいアップグレードについて文句は言わないけど、これは高いな。入力サイズに基づく差別的な価格設定を見るのは面白いけど、注意のO(n^2)の性質を考えると理解できる。

1Mの入力… $6/1Mトークン。ちゃんと一発で答えを出してくれることを願うよ。

わお、GPT5 APIのコストから価格圧力を感じると思ってたけど、彼らは他の誰よりも高いAPIをさらに強化してるね。

新しいベンチマークを完了したんだけど、Anthropicのプレミアムが本当に価値があるかどうかが少し見えてきた。(短い答え: スピードが最優先でない限り、価値はない。) https://brokk.ai/power-rankings

それ以前は、彼らはChatGPTよりも長いコンテキストウィンドウを持っていたらしいけど、俺はコンテキストウィンドウをガンガン使うワークロード(100-120Kトークン)を持ってるんだ。ChatGPTは本当に32Kのコンテキストウィンドウを持ってるみたいで、その範囲内のことをちゃんと覚えて使える感じ。Claudeは以前「200K」のコンテキストウィンドウを持ってたけど、テスト中にはフルの32Kにすら達せず、早い段階で忘れちゃうことが多かった。あと、他のサービスに比べてプロンプトの制限がすごく短いから、彼らの言ってる大きいコンテキストウィンドウをうまく使うのが難しいんだよね(ちょっと怪しい)。要するに、Anthropicに関しては、彼らの主張をあまり信用してない。これは俺の個人的な経験から来てる。今の「1M」のコンテキストウィンドウが本当に200Kを使えるようになってればいいけど、果たしてそれができるかどうかはまだ分からない。Anthropicに関しては、彼らの主張を全部確認する必要があるってことだね。

1MトークンのコンテキストはGeminiの目玉機能だったんだ。今、Claudeにお願いしたいのは、ドキュメント処理にカウントされるトークンについてなんだ。Geminiは同じドキュメントに対して、Anthropicの10分の1のトークンで請求することが多いからね。

これ、Claude Codeで次の環境変数を使って設定できると思うよ:ANTHROPIC_BETAS="context-1m-2025-08-07" claude