概要
本記事は、 人間一人 と LLMエージェント一体 で、ゼロから HTML/CSSレンダリング専用ブラウザ を約3日間で構築した体験記です。 サードパーティRustライブラリ不使用、主要OS対応など独自の制約下での開発過程を紹介します。 開発フロー、苦労、成果物、気づき を簡潔にまとめています。 実際のコード行数や リポジトリ情報 も記載しています。 最終的に「 一人+一エージェント」の生産性について考察しています。
たった一人と一つのエージェントでブラウザを作る挑戦記
- 目的 :HTMLとCSSをレンダリングできる シンプルなブラウザ を、一週間で数百万トークン・数百万行のコード生成を目指して開発
- 動機 :VC投資獲得を狙ったが、「 人間の脳 は機械より優秀」と再認識し、LLMエージェントと協力する方針に
- デモ :.webm動画形式で動作を披露、本質は 動画化された高度なブラウザ の証明
- 開発環境 :Linux/X11上で動作、最終的に Windows・macOS・Linux 対応
開発要件
- 3日間 で開発完了
- サードパーティRustライブラリ完全禁止
- OS標準提供のもののみ利用可能
- 主要3OS対応 (Windows, macOS, Linux)
- 最低限のWebサイト表示 (自身のブログ、Hacker News)
- 常にビルド可能 なコードベース
- 人間が読める コード(ただし品質は二の次)
Day 1:基礎部分の構築
- "Hello World"描画 からスタート
- ネストタグ対応 や スクリーンショット機能 追加
- HTML/CSS仕様書 作成(エージェントは未活用)
- 回帰テスト・E2Eテスト 導入
- リンククリック機能 追加
- Codex と協働し、X11とcURLでWebサイト取得・描画
- Cargo.lock空、約7500行のコード、ファイルごとに1000行未満遵守
Day 2:機能拡張・安定化
- --headlessフラグ 追加、テスト時のウィンドウ表示抑制
- ウィンドウリサイズ・互換性・パフォーマンス 改善
- フォント/テキスト描画強化
- 作業フロー :Webサイトを選び、JavaScript無しのスクショをエージェントに渡して再現指示
- 人間は進捗確認のみ、大半はエージェントが自律作業
Day 3〜4:磨き上げとクロスプラットフォーム対応
- 大規模な新機能追加・回帰テスト増強
- パフォーマンス・クラッシュ修正
- スクロール・デバッグログ・バックボタン 対応
- macOS/Windowsサポート 実装、テストも通過
- CI(継続的インテグレーション) で3OS対応を確認しリリース
- 72時間以内 に全開発を完遂
実装結果・コード統計
- 約2万行のRustコード、72ファイル
- 主要ファイル例 :
- src/layout/flex.rs:994行
- src/layout/inline.rs:933行
- src/browser.rs:867行
- リポジトリ : https://github.com/embedding-shapes/one-agent-one-browser/releases 誰でもクローン・ビルド・試用可能
気づき・考察
- 「人間一人+エージェント一体」 の方が、 多人数・多エージェント構成 より効率的な場合も
- 一つのコードベース を一エージェントが長時間担当することで、野心的なプロジェクトも進む
- 複数人+各自エージェント 体制なら、さらに大規模な成果も期待
- 「遅いことが結果的に速い」 こともある
- 人間側の力量が最重要 で、エージェントの設定よりも影響大
- 何百ものエージェントを投入しても、一人+一エージェントの方が結果が良い場合があると示唆
関連リンク
- Simon Willisonによる関連記事 : https://simonwillison.net/2026/Jan/27/one-human-one-agent-on...
この挑戦は、現代のAI開発現場において「 人間の創造力とAIの実装力」が組み合わさることの可能性や、効率的な開発体制のヒントを与えます。