世界を動かす技術を、日本語で。

Claude Codeセッションのチームを編成する

概要

  • Claude Code のAgent Teamsは複数インスタンスの協調作業を実現
  • チームリード が全体を指揮し、各Teammateが独立して作業
  • Subagentsとの違いは 直接コミュニケーション や独立性
  • 並列探索や協調作業 に最適、トークン消費は多め
  • 有効化手順や操作方法、ベストプラクティスを解説

Agent Teamsの概要と用途

  • Agent Teams は複数のClaude Codeインスタンスを連携させる機能
  • チームリード が指示・タスク割り当て・結果統合を担当
  • Teammate は独自のコンテキストウィンドウで独立作業
  • Teammate同士で 直接メッセージ送信、リードを介さず個別指示も可能
  • Subagents との違いは、同一セッション内動作・リードのみへの報告制限
  • 並列探索が価値を生むタスク (リサーチ、レビュー、複数モジュール開発、仮説検証など)に最適
  • 順次処理や依存度が高い作業 は単一セッションやSubagentsが適する

Subagentsとの比較

| 項目 | Subagents | Agent Teams | |-----------------|--------------------------------|---------------------------------------------| | コンテキスト | 各自独立、結果はリードへ報告 | 各自独立、完全独立動作 | | 通信 | リードのみ | Teammate間で直接通信可能 | | 調整 | リードが全作業を管理 | 共有タスクリストで自己調整 | | 適用例 | 結果のみ重要な単純作業 | 議論・協調が必要な複雑タスク | | トークン消費 | 低(結果のみ要約) | 高(各Teammateが独立Claudeインスタンス) |

  • 迅速な単純作業 はSubagents、 協調が必要な作業 はAgent Teams推奨

Agent Teamsの有効化と起動

  • デフォルトでは 無効、有効化には環境変数設定が必要
    • CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 をシェルまたはsettings.jsonに設定
  • 有効化後、 自然言語でチーム作成指示 (例:「UX・技術・デビルズアドボケートでチーム作成」)
  • Claudeが タスクリスト作成・Teammate生成・役割分担 を自動実施
  • リードのターミナル で全Teammateと作業内容を一覧表示

表示モードと操作

  • In-processモード :全Teammateがメインターミナル内で動作
    • Shift+Up/DownでTeammate選択、直接メッセージ送信
  • Split panesモード :各Teammateが独立ペインを持つ
    • tmuxまたはiTerm2+it2 CLIが必要
    • すべての出力を同時表示、ペインをクリックし個別操作可能
  • モードは settings.json やCLIフラグで切替可能

Teammate・モデル指定とプラン承認

  • Claudeが 自動でTeammate数決定、または明示指定可能
    • 例:「4人チームで並列リファクタ」「各TeammateにSonnet使用」
  • プラン承認モード :リードがTeammateの作業計画を承認するまで実装不可
    • 承認基準もプロンプトで指定可能(例:「テストカバレッジ必須」)

デリゲートモードと直接指示

  • Delegateモード :リードは調整専用、実装作業せず
    • Shift+Tabで切替、分担・統合に専念
  • 各Teammateは 独立セッション、個別に追加指示や質問可能

タスク管理と終了処理

  • 共有タスクリスト で進捗管理、リード割当または各自セルフクレーム
    • タスク状態:pending / in progress / completed
    • 依存関係も自動管理、ファイルロックで競合防止
  • Teammateの シャットダウン はリード経由でリクエスト
  • チームクリーンアップ は全Teammate終了後に実行

アーキテクチャと内部構造

  • 構成要素
    • Team lead:メインセッション、チーム生成・調整担当
    • Teammates:独立Claude Codeインスタンス
    • タスクリスト:共有作業項目リスト
    • メールボックス:エージェント間メッセージング
  • チーム・タスク情報は ローカル保存 (例:~/.claude/teams/)
  • パーミッション はリード設定を継承、個別変更も可能
  • 各Teammateのコンテキスト は独立、プロジェクト情報・スキルも個別ロード
  • 自動メッセージ配信、タスク進捗・完了通知も自動
  • ブロードキャスト はチームサイズに比例しコスト増

トークン消費とコスト

  • Agent Teamsは 単一セッションより大幅に多くのトークン を消費
  • 並列リサーチや新機能開発にはコストに見合う価値
  • ルーチン作業は 単一セッションが効率的

代表的なユースケース例

  • 並列コードレビュー
    • セキュリティ・パフォーマンス・テストカバレッジなど、各観点ごとにTeammateを割当
    • 独立視点で同時レビュー、結果を統合
  • 複数モジュールの並列リファクタ
    • 各Teammateが異なるモジュールを担当、干渉せず進行
  • 仮説検証型デバッグ
    • 複数の仮説を同時検証、迅速な原因特定
  • フロント・バック・テストのクロスレイヤー調整
    • それぞれ専任Teammateで効率分担

ベストプラクティス

  • Teammateの独立性 が高いタスクで最大効率
  • 依存関係や逐次処理が多い場合 は単一セッション推奨
  • タスク分割・役割明確化 が重要
  • トークンコスト を考慮、目的に応じて最適モード選択

Agent Teamsを活用することで、 複雑な協調作業や並列探索 が大幅に効率化。用途やコストに応じて 最適な構成・運用 を心掛けることが重要。

Hackerたちの意見

ガスタウンに似てる感じだね。

でも、デザインはずっとシンプルそうだね(特別なエージェントが一人だけで、あとは全部ワーカーって感じ。ガスタウンは市長やポールキャット、証人とか8つの役割があったのに)。どう比較されるんだろう?

でも、ポールキャットがいないのは残念だね。

「ガスタウンに似てる感じだね」 こういう世界にいるって最高だよね。クレイジーな科学者たちが、私たちが最終的にたどり着く道を示してくれてるけど、まだ少し荒削りで新しいから。全く新しい抽象概念がリアルタイムで発見されていくのを見るのは、キャリアの中で一番ワクワクすることだよ。

Gas Townが何かは知らないけど、Claude Code Agent Teamsはしばらくやってたことだよ。メインの会話を使ってサブエージェントを生み出して計画や実行をすることで、文脈を失わずに長時間作業できるんだ。トークンを多く使う作業はサブエージェントがそれぞれの文脈でやるから、Claude Code Agent Teamsはこのワークフローを効率化してるみたいだね。

私はウィムジーに反対じゃないけど、プロジェクトがウィムジー(変なAI生成の動物アートとか)に偏りすぎると、誰かがウィムジーなしのクローンを作るのは避けられないよ。そのバージョンの方が、普通の人に説明するのがずっと恥ずかしくないから勝っちゃうんだよね。

ところで、ポールキャットたちはどこにいるの?市長の犬はどうなった?

こういうのがあると、インフラの整備が足りてないかも。需要がめちゃくちゃ増えそう。

CCが必要な権限を全部事前に把握して、夜間にジョブをキューに入れられるといいな。

注目している人なら、LLM(大規模言語モデル)を動かせるコンピュータの需要(GPU、TPU、さらにはCPUまで)が爆発的に増えるのは分かってたよね。これから数年はずっと大きな需要が続くと思う。ただ、HNには「AIが嫌い」とか、そういう反対意見ばかり言ってる人たちがいて、こういう現実を認めようとしないんだよね。彼らは自分が蒔かなかった種からは収穫できず、この新しい世界で困ることになるだろうね。

ソフトウェアの非効率性の次の次元を解放中!でも、生成されたコードが今あるものより良くなることを願ってるよ。これ以上悪くなってほしくないし、RAMもそんなに余裕ないからね。

こんなの探してるんだ。オーパスが主導して、サブエージェントがジェミニやコーデックスみたいな別のLLMを使う感じ。そんなツール知ってる人いる? just-every/codeはほぼこれをやってるけど、リード/オーケストレーターがいつもコーデックスだから、オーパスやジェミニに比べて遅く感じるんだよね。

これが未来のカーソル機能の良さだと思う。サブジョブに応じて、いろんなモデルプロバイダーを調整できるから。

OpenRouterを通じて、Claude Code Routerで複数のLLM(Opus、Gemini、Codex)を同時に動かせるよ。Subagentsをサポートしていて、Opencodeのように特定のLLMに縛られないエージェントCLIを使えばね。Pied-Piperというサブエージェントオーケストレーターの例があって、これがClaude CodeやClaudeCodeRouterで動いて、各サブエージェントに異なるモデルや役割を使ってるんだ。1. 計画用にGPT-5.2 Codex Max 2. 実装用にOpus 4.5 3. レビュー用にGemini モデルを簡単に入れ替えたり、役割を変えたりできるよ。詳細はここにあるよ: https://github.com/sathish316/pied-piper/blob/main/docs/play...

Augmentではこれに取り組んでるよ。マルチエージェントのオーケストレーション、仕様駆動、異なるタスクに対する異なるモデルなどね。https://www.augmentcode.com/product/intent では、コードAUGGIEを使うとキューをスキップできるよ。自分のエージェント(CodexやCCなどを使ったもの)が来週登場する予定だよ。

コーディングにはOpusを使って、レビューにはCodexを使ってるよ。各作業タスクでレビューをトリガーするために、Codexを呼び出すレビュー用スキルを使ってる[0]。それ以上複雑なことは必要ないし、うまくいってるよ。PRではgreptile[1]も動かしてる。[0] https://github.com/nc9/skills/tree/main/review [1] https://www.greptile.com/

Claude Codeに大きなタスクを独立してやらせるのは全然信頼できないな。たぶん他の人はそれほど複雑じゃないソフトウェアを扱ってるんだろうけど、コードのクオリティを保つためには、もっとデザインプロセスを導く必要があるんだ。エージェントのチームって、レビューやリファクタリングが増えるだけで、問題をじっくり考えてゆっくり進めることで避けられると思う。

何かしらのPLAN.mdとPROGRESS.mdをコマンドで作成して、作業を委任する実装コマンドを作らないとダメだよ。それがないと、どんなに「良い」タスク機能があっても大きなことはできない。すぐに文脈が切れちゃうし、持続的なガイダンスがないと物事がうまくいかなくなるからね。

現在、タスクを分けてLLMの回答を組み合わせる方法についての研究が進められているよ。このアプローチを使うと、1百万ステップが必要な問題を解決するみたいな結果に到達できるんだ。そうじゃなきゃ無理だったかもね。

その通り、4つか3つのプロンプトのうち1つは調整が必要だし、ちょっと手を加えたり、止めたりする必要がある。でも、どこがズレてるかを見るには経験が必要だよね。多くの人はCCがオフになってることに気づいてないと思う。動いてるし、テストも通るから、良いってことなんだよね。

同意するけど、クロードの中で「対立的」なモデルを作ると、質がかなり上がることに気づいたよ。一つのエージェントが変更を加えて、もう一つがその穴を指摘する。これを繰り返すと、最終的にはレビューするものが少なくなるんだ。これは単にN倍の作業というより、そのアイデアの自動化に近いね。

人間も大きなタスクを扱えないから、管理しやすい部分に分けるんだよ。クロードに計画を作らせて、自分でレビュー・編集すればいい。成功基準やテストを追加すれば、もっと良い結果が得られるよ。

コードベースの整理方法や、パターンxとパターンyの使い分け、実際のコードベースの例を含めた一般的なアーキテクチャ文書を書いて、それをスキルとしてエンコードするんだ。で、プロンプトでやりたいタスクを伝えて、アーキテクチャスキルに従うサブエージェントに実装を監督させる。提案された変更を評価するんだ。これを最大限に活用する人たちがいて、チームを作る方法はこんな感じ。計画、デザイン、QA、プロダクト、エンジニアリング、レビュー、リリース管理などのためのエージェントを作って、彼らに協力させて成果を出すんだ。これが本来の目的で、ベストプラクティスじゃなくて機能としてエンコードされてるんだよ。

プロセスの各ステップにレビューエージェントが必要だね。プランナーが生成したプラン、タスクワーカーのサブエージェントが行った更新、全てのタスクが終わった後の最終レビューをするために。これ、トークンをすごく消費するけどね :(

サブエージェントはもうダメだ、エージェントチームに全部かけよう!

ガスタウンと比較してる人たちへ:スティーブ・イェッジが数ヶ月前にエージェントオーケストレーターをアンソロピックなどに提案したことを忘れないでね。 > 「私はTemporalやAnthropicのような会社の上層部に行って、エージェントオーケストレーターを作るべきだと言ったんだ。Claude Codeはただのビルディングブロックで、AIワークフローや『エージェントのためのKubernetes』が全てになるってね。私はいくつかのイベントでオーケストレーターのビジョンを語ったし、どこにでも行ったよ。」(「Welcome to Gas Town」から)今、Anthropicがエージェントチームをリリースするって噂があるけど、スティーブがオーケストレーターを提案した時からすでに少しは作ってたか、彼が正しかったと判断してエージェントをスケールする時が来たってことだと思う。あるいは、独自に同じ結論に達したのかもしれないね。大局的にはどちらでも大したことじゃないけど。スティーブはこれが存在することを大いに評価してると思うし、むしろ彼のビジョンのバリデーションだよね。数ヶ月後には公式にポールキャットを集めることになるかも。

この分野では収束進化がたくさん起きてるみたいだね。ガスタウンの hype が来る数日前に、私は(もっとシンプルで、もっと落ち着いた)「エージェントチーム」のセットアップを作ったんだ。ラルフ・ウィグムループを起動するシェルスクリプトと、ラルフ間のコミュニケーション用のCLAUDE-MESSAGE-BUS.mdをね(スレッドセーフは .claude.lock ファイルでハックした)。メインのクラウドインスタンスには、好きなだけラルフループを起動するよう指示してる。進捗を定期的に追跡するために、一定時間スリープするように指示してるんだ。まあまあうまくいったけど、今のところこのやり方は好きじゃないな。今はエージェントループを満たすために仕様(またはメタ仕様)ファイルを早く書けないし、出力のQAも十分にできてないから…ほとんど私の問題かな?

正直、これは私が持ってるアイデアの一つに過ぎない。でも、これがAIの分野でまだやるべきことがたくさんあることを示してるね。

両方のアプローチを成熟したアクターフレームワークと比べると、あんまり新しいことはないみたい。こういう監視ツリーや階層構造は、アクターシステムでは新しくないし、LLMエージェントが協力して働く明らかな応用だよね。AnthropicやOpenAIが、コンテキストウィンドウの問題や信頼できない自己検証を考慮しても、こんなに長い間オーケストレーションなしでやってるのは、基本的なシステムの成熟度がデフォルトのAkkaインストールから得られるものに達してないってことを示してる。これらの主要なLLMプロバイダー(俺たちよりもお金やトークン、契約、アクセス、優秀な社員が多い)は、リアルタイムで学んでるんだ。次世代のハイプマシンのワンダーエージェントの大部分は、cronや基本的なアクターシステムのスクリプトで実現可能だよ。決定論的に、一度書けば永遠に動く、サブスクリプションも不要。エージェントのためのKubernetesは、クソみたいなKubernetes管理者として言わせてもらうと、大した飛躍じゃない。俺はローカルのドゥームコーディングエージェントをこうやって繋げてきた。Googleの人たち(KubernetesやLLMのことに結構詳しい)が、そこにいるのも納得だね。彼らがこれを構築しているのを見るのはいいことだし、LLMクラスタの失敗が増えるのか(悪いコピーが繰り返されるみたいに)、それとも無効化されるのか(「ごめん、デイブ、またFacebookを作る手助けはしないよ。人類に害を与えちゃいけないし、PHPもあるから…無理。」)を見るのが楽しみ。

これは新しいことじゃないよ、みんな2023年からやってるし。arxivにはたくさんの論文があって、GitHubにはマルチエージェントの実装コードがたくさんある。…その頃のエージェントはあまり賢くなかったし、コンテキストウィンドウもずっと小さかった。RLVRもなかったから、エージェントは関数呼び出しのためだけに訓練されてたけど、エージェント呼び出しや調整はされてなかった。そこからずっとやってきたけど、違いはモデルが本当に賢くなって、うまく扱えるようになったことだね。

彼だけがこのアイデアを思いついたわけじゃないよ。GasTownやBeedsについて知らずに似たようなものを作ったことがあるし。これはただの明らかな次のステップだよ。 https://github.com/mohsen1/claude-code-orchestrator

私の月20ドルのサブスクリプションが10分持つかな。

特定のタスクにはHaikuでいい結果が出てるよ。

あー、同じく。これがどうやって何かを達成するのかずっと疑問に思ってる。

現時点で自腹を切ってるなら、KimiかGLMを使った方が意味があるよ。

俺はこの手のワークフローには全く興味ないな。作業ツリーで並行してクロードのコードインスタンスを使うのは好きだけど、それ以上は特にない。

自分のBeadsの代替案を作ってたんだけど…似たようなものでこれができることに気づいたんだ。今のところ自分が持ってるものが気に入ってるから、すぐにオープンソースにする予定だよ。タスクを直接GitHubプロジェクトに同期できるようにもしたし、歴史的な理由からエージェントタスクを実際のチケッティングシステムに同期させる方が有用だと思う。それに、エージェントに依存しない代替案がある方がいいよね。

これまでこのツールを学ぶのを控えてたんだけど、ネイティブで作られるのが明らかだと思ってたから。いつか試してみるつもりだよ!