概要
- AIエージェントを工場のように組み合わせて、コード生成・検証・改善を自動化する手法の紹介。
- 出力(生成コード)は使い捨て とし、プランやプロンプト(入力)を改善して品質向上を図る考え方。
- 複数のAIモデル (claude、o3、sonnetなど)を役割ごとに使い分け、並行して機能開発を進行。
- ワークフローの自動化・拡張性 を重視し、エージェントの自己改善サイクルを実現。
- 今後の課題 として、より高度なエージェント連携や抽象度の高い情報活用を目指す。
AIエージェント工場の構築と運用
- claude codeを主なインターフェース として利用し、各git-worktreeごとにウィンドウを分割運用。
- o3・sonnet 4は計画立案、 sonnet 3.7やsonnet 4は計画実行、 o3は結果検証 を担当。
- コード生成に問題があれば、出力を直接修正せず、計画やプロンプトを改善 し再実行。
- Factorioのような自己増殖型工場 をAIエージェントで再現し、コード生成・検証・自己改善のループを構築。
- 複数のclaude codeインスタンスとgit worktree を活用し、並行して複数機能の開発を実現。
基本ワークフロー
-
Step 1: 計画立案
- 高レベルのタスクをclaude codeに指示
- o3が計画を作成 し、clarificationの質問も実施
- <task>-plan.mdに依頼内容と実装計画を記載
-
Step 2: 実行
- sonnet 4が計画を検証・タスクリスト化
- claude codeが、sonnet 3.7またはsonnet 4でタスクを実行
- 各ステップごとにコミットを作成 し、ロールバックも容易に
-
Step 3: 検証とフィードバック
- sonnet 4とo3がコードを計画・依頼内容と照合し検証
- o3は妥協せず不要な互換性コードやlint無視フラグを指摘
- 指摘事項はプランテンプレートに反映し、コード自体は直接修正しない
入力重視の理由と実例
- 出力は使い捨て、計画・プロンプトは蓄積資産
- ソースでのデバッグは将来すべてのタスクに効果を波及
- 例:CSV全読み込みからストリーミングに変更→以後の計画で自動チェック
工場のスケールアップ
-
特定タスクごとに専用エージェント(MCP)を用意
- 例:clojureコードのスタイルルール適用専用エージェント
- 例:リトライ処理の共通ライブラリ化
-
小規模エージェントを組み合わせて複雑なワークフローを構築
- 例:APIドキュメント+ビジネスケースから統合・テスト・ドキュメントを自動生成
-
並列実行・反復で効率化
- 複数エージェントを同時実行し、失敗や不足情報は次回にフィードバック
- 出力修正を避け、常に入力(計画・指示)を改善
今後の展望と課題
- エージェント間の自動調整・ワークフロー自動化
- ビジネスドキュメントの抽象度向上とエージェント活用性の強化
- より複雑なワークフロー・多エージェント連携の推進
- プロバイダーごとのトークン制限への柔軟対応(claude max/bedrock間の切り替え等)
結論:本質は「入力を直す」こと
- 工場はコーヒーを淹れている間にコードを出せるレベル に到達
- 本質は「出力ではなく入力を直す」こと
- 制約は変わるが、原則は変わらない