AIが「ブラウザを構築」する時、話題を信じる前にリポジトリを確認せよ

2026年1月27日原文(theregister.com)

概要

Cursor社がAIによってWebブラウザを開発したと主張
実際には動作が不安定で誇張された宣伝
コードの品質や完成度に多くの疑問
AI開発の現実と宣伝のギャップが浮き彫り
実用的な成果が求められるAI業界の現状

Cursor社の「AI製Webブラウザ」誇張問題

AI統合型IDE企業の Cursor が、AIエージェントによるWebブラウザ開発を発表
CEOの Michael Truell が「GPT-5.2でブラウザを作成」とSNSで発言
「3M超のコード行数」「Rustによる独自レンダリングエンジン」「カスタムJS VM」など技術的な主張
しかし「 kind of works」と控えめな動作保証
多数のメディアやSNSが「AIが1週間でWebブラウザを構築」と報道
- 実態は大きく異なる誇張宣伝

実際の成果と開発現場の反応

エンジニア Wilson Lin のブログでは、動作例動画と「ゼロからのブラウザ開発は非常に困難」との言及
GitHubでコード公開され、開発者たちが 実際にビルド・検証
多くの問題点が発覚
- コードが ほぼコンパイル不可
- 実行も困難、マーケティング内容と乖離
- 「3M行の新規コード」も実質的な成果は 半完成品 レベル

技術的問題点と他プロジェクトの利用

Chromiumのクローンと比較し、 機能面で大きく劣る
コミットはビルドエラーが頻発、 GitHub Actions も失敗続き
手動パッチでビルド成功しても、 読み込み速度が非常に遅い
「ゼロから開発」と主張しつつ、 Servo（Rust製レンダリングエンジン） や QuickJS（JavaScriptエンジン） など既存プロジェクトに大きく依存
JSエンジンもエンジニア個人のプロジェクト流用で、「ゼロから」とは言い難い

外部からの批判と設計上の問題

Servoメンテナの Gregory Terzian が「 スパゲッティコード」「実用的なWebエンジンには到底なり得ない」と酷評
独自設計ではあるが、 品質・設計面で重大な問題

AI開発と宣伝のギャップ

Cursor社の「実験」は本来、 内向きな学習プロジェクト に近い内容
しかし宣伝では マイルストーン達成 として発信、過大評価を助長
必須要件である CI合格・再現可能ビルド・実用的ベンチマーク が欠如

AI開発の現状と今後の課題

AIが「 1年以内にコードの9割を書く」とのCEO予測が飛び交う一方、現実は 多くのAIプロジェクトがROIを出せていない
開発者向けAIツールは 補助的な自動補完・リファクタリング で実用価値を発揮
しかし「AIがプロジェクト全体を自律開発」という過剰な期待が蔓延
検証や品質管理を省略し、 デモと実際の成果物の区別が曖昧化

結論：AIの実利重視への転換

OpenAIのCFO Sarah Friar も「2026年は実用的なAI導入に注力」と言及
現実的な成果 を示してから、AIの本格導入を議論すべき段階

Hackerたちの意見

「AIがブラウザを書くのを任せられるようになった」って言いたかったわけじゃないと思う。ツールがどれだけ進化したかを示したかったんじゃないかな。生産品質を目指してるわけじゃなくて、AIコーディングの現状を印象的にデモするためのものだよ。完全に崩れ落ちることなく、どこまでできるかを見せてるんだ。編集：自分の主張を撤回するよ。これにservoが依存関係としてあるとは気づかなかった。

└

そうかもしれないけど、最終的にservo.render()を呼ぶために300万行のコードが必要ってのは、AIコーディングの良さを示すにはあまり良い方法じゃないと思う。

└

うん、でも生産品質に近いコードベースから始めて、それを生産品質からかけ離れたものに変えてしまうのは…あんまり印象的じゃないよね。

└

これは全然甘すぎるよ。基本的にこれが証明するのは、エージェントが1週間くらいループで動けるってことだけだよ。誰もそれを疑ってたわけじゃないでしょ？彼らは、エージェントが自分でブラウザを作れるところまで近づいてるかのようにマーケティングしてたけど、正当な反発を受けるのは当然だよ。これは、どれだけお金が投じられているかという点で非常に重要な問題で、全員に影響を与えるからね。「ステークホルダー」だけじゃない。もし本当にエージェントにブラウザを作らせることができて、それが実現するなら、それは非常に重要なことだと思う。今の時点では、実際にそうなるかどうかは予測できないけど、もしそうなったら影響はかなり大きそうだね。

└

Servoは依存関係に入ってなかったよ。Cargo.tomlを見てみて: https://github.com/wilsonzlin/fastrender/blob/19bf1036105d4e...

└

それは、ツールがどれだけ進化したかを示すためだったと思う。無駄なものの生産量の観点から？

「無数の行のコード」が、一般の人には印象的に聞こえるからって、合理的な指標として再ブランド化されたのには驚いたよ。結局、LLMが最適化するのが得意な唯一のものだからね。

└

これらの「指標」は、投資家を騙して、誇大広告された会社にお金を投げさせるために意図的に作られてるんだよ。進歩してるように聞こえるからね。実際には、AIがコンパイルできない混乱を作り出して、100以上の依存関係を追加して、別のブラウザからレンダラーを丸ごとインポートすることになった（servo）。それを整理するのは人間のソフトウェアエンジニアがやらなきゃいけなかったんだ。

└

それが気になった。自分はブラウザをゼロから作ったことはないけど、何百万行のコードが必要だって聞くと、なんかおかしい気がした。もしかしたらそれが必要なのかもしれないけど、300万行もない巨大なモノレポで、ビジネス全体の機能を支えてたこともあるからね。

└

マジでヤバいよね。もっとLOCが多いほどソフトウェアが良くなるっていう考え方はもう終わったと思ってたのに、これにはびっくりだよ。最近の会議で、あるディレクターが「1日に何万行もコードを書いた」ってクラウドを褒めてたけど、その数字自体に価値があるみたいに言っててさ。あと、「あなたのコードの何パーセントがAIによって書かれたの？」って話にも触れたくないわ。

└

完全に同意だわ。問題は、いくつかの誤解が全然消えないこと。1980年代にはコードの行数がメトリックとして悪いって話が出てたのに、今でもその考えが続いてるのは、開発者の生産性を測りたいっていう根深い欲求があるからだと思う。生産性を測る指標がないよりは、悪い指標でも持っていたいんだよね。

└

KPIがアメリカ経済を少しずつ壊してるよ。すべてを簡単なメトリックで意味のある形で測れるっていう考えは、過剰に報酬を受け取ってるビジネスコンサルタントが広めた神話だよ。馬鹿げてるし、皮肉だね。そうしようとする試みはすべて、劣化して逆効果になってる。

Hacker Newsで議論の続きを見る

ハクソク