最近、自分専用のコーディングエージェントを作ったんだ。市販のものに満足できなかったからね(でもClaude CodeのUIはすごくいい)。記事に書いてある通りに動くよ。カスタムDockerコンテナを起動して、モデルに対してシェルスクリプトを送信して、それをコンテナ内で実行するんだ。このコンテナには、エージェントの作業を楽にするためのCLIツールも追加してる。うちのエージェントは他にもいくつかのトリックを持ってて、まだ新しいから色んなアイデアを試してるところなんだけど、いくつか気づいたことがある。一つは、GPT-5がすごく推測するのに前向きだってこと。これはプロンプトの仕方にもよるけど、一つのスクリプトで五つか六つのことを同時に試そうとするスクリプトを書くのが得意なんだ。存在しないかもしれないファイルを読むことも含めてね。この推測実行のレベルは、特にGPT-5が考えるのが好きで遅いモデルだから、全体のスピードを劇的に上げるんだ。もう一つは、すごく複雑な「ミッション」を与えても、他のエージェントでは見たことがないような戦術で完了させることができるってこと。例えば、ライブラリの依存関係の中に埋もれている何かをチェックする必要があれば、上流のリポジトリをホームディレクトリにクローンして、必要なものを見つけるまで探ってから、ユーザーのプロジェクトに戻るんだ。これらはすべてコンテナ内で動いているから、ユーザーとのインタラクションは一切発生しない。実際、ユーザーとのインタラクションは不可能なんだ。動かし始めたら、終わるまで他のことをしてる感じ。モデルは「ミッション」をキューに入れて、並行して実行できるようになってるから、最後にそれをまとめるんだ。エージェントには、ミッションを受け取って仕様を書いて、レビューして、レビューに基づいて仕様を更新して、コーディングして、コードをレビューするモードもある。まだ初期段階だけど、このエージェントには20分間連続で推論したミッションを設定したことがあって、素晴らしい結果を出したよ。このUIのパラダイムが今後の方向性だと思う。エージェントと常にインタラクションしなければならないなら、AI支援のコーディングはスケールアップできないからね。モデルを最大限に活用するには、並行処理を最大限に活かす必要があるから、サンドボックス化は必須だね。