概要
- LLMの コンテキストウィンドウ には「スマートゾーン」と「ダムゾーン」が存在
- 100kトークン 付近で性能が大きく低下
- 広告される大容量ウィンドウは 実用的な作業セット とは異なる
- 自動要約 やアーティファクト活用で性能劣化を回避
- コンテキストは予算管理 として扱うべき
LLMのコンテキストウィンドウ:スマートゾーンとダムゾーン
- LLMの コンテキストウィンドウ は「スマートゾーン」と「ダムゾーン」に分割される考え方
- スマートゾーン :モデルが鋭く動作する領域
- ダムゾーン :注意力が落ち、過去の情報を忘れ始める領域
- 境界は 約100kトークン 付近に存在
- 広告される 200kや1Mトークン のウィンドウは、実際の「使える」範囲を示さない
- 研究( RULER や Chroma のcontext rotレポート)でも、実効コンテキストは公称値のごく一部であることが示されている
- コンテキストウィンドウの 大きな数字はマーケティング用 であり、実際の性能とは乖離
コーディングエージェントとコンテキスト管理の課題
- 現代の AIエージェント は大量のトークンを高速消費
- 複数ファイルの読み込み、長いデバッグ、広範なテストで すぐ100kトークン超え
- エージェントは ダムゾーン に突入しても気づかず進行
- ベンダーは大容量ウィンドウを宣伝するが、 実際の作業効率には直結しない
自動要約とアーティファクトによる対策
- Claude Codeなどのツールは 自動コンパクション(要約) 機能を搭載
- セッションが長くなると履歴を要約してリフレッシュ
- ただし、 要約自体が既に劣化したモデルで生成 されるため完全ではない
- より良い方法として、 新規セッション を開き、自分で書いた 仕様(spec) を渡す手法
- 手動で何が重要かを選別できるため、 自動要約より高品質な引き継ぎ
- 「パンくずリレー」方式で次のセッションや担当者がスムーズに作業継続可能
アーティファクト中心のワークフロー設計
- obra/superpowers や mattpocock/skills などのプロジェクトでは、アーティファクトを基盤にしたエージェントワークフローを設計
- PRD、プラン、スキル、サブエージェントへの引き継ぎなど
- 各アーティファクトが「スマートゾーン」を維持するための情報移動手段
- 作業セッション内の情報をアーティファクトに移し、次のセッションで再利用 することで、注意力の低下を防止
コンテキストウィンドウの「予算管理」的活用法
- コンテキストウィンドウは有限なリソース として扱うべき
- 実際に「効く」のは 最初のチャンク のみと仮定
- ライブセッションからアーティファクトへ情報を移す ことで、注意力の配分を最適化
- 「使える部分」と「広告される数字」のギャップを常に意識した運用が重要