バイブコーディングとエージェンティックエンジニアリングが思っていたよりも近づいている

2026年5月7日原文(simonwillison.net)

概要

AIコーディングツール の進化により、開発スタイルが大きく変化
Vibe coding と agentic engineering の境界が曖昧化
コード生成の信頼性向上が 責任感や評価基準 に影響
ソフトウェア開発の ボトルネック がシフト
経験や実運用 の重要性が増す

AIコーディングパラダイムシフト：Vibe CodingとAgentic Engineeringの融合

Heavybit’s High Leverage podcast Ep. #9でのAIコーディングツールに関する議論
Vibe coding は、プログラミング経験がないユーザーでもAIに指示して動作するものを生成する手法
- コード品質や追加制約を気にせず、動けば良いというスタンス
- 個人利用では有効だが、他者向けソフトウェアでは 無責任 とされる
Agentic engineering は、プロのソフトウェアエンジニアがAIツールを活用し、セキュリティや保守性、運用、パフォーマンスなどを重視する手法
- 高品質なプロダクションシステムの構築が目的
最近は 両者の境界が曖昧化 し、自分の作業でも混在し始めている現状

コードレビューと責任の変化

AIエージェントの信頼性向上により、 全コードのレビューを省略 しがち
Claude CodeなどのAIは、特定のタスク（例：JSON APIエンドポイント作成）で高精度なコード生成が可能
- テストやドキュメントも自動生成
責任の所在 が曖昧に
- 人間チームは評判や責任を持つが、AIには プロとしての信頼性や責任感がない
- 成果物が正しいことが続くと、 過信によるリスク も発生

ソフトウェア評価基準の変化

以前は コミット数やREADME、テスト の充実度でプロジェクトの質を評価
現在はAIで 短時間で見た目上高品質なリポジトリ が作成可能
最も重視すべきは 実際に使われているかどうか
- 実運用され、継続的に使われているものの価値が上昇

開発プロセスのボトルネックの変化

AIの活用で コード生産速度が飛躍的に向上
- 200行/日から2,000行/日も可能に
従来の開発プロセスやデザインプロセスが 前提としていたコスト構造が崩壊
- Jenny Wen（Anthropic）の講演：設計ミスのコスト低減により、 デザインプロセスも再考 が必要

エンジニアのキャリアとAI

AIツールは 経験豊富なエンジニアの能力を増幅
- 経験があるほど、AIの恩恵をより大きく享受
ソフトウェア開発は本質的に 依然として困難
- AIが全てを自動化しても、 本質的な難しさは残る
Matthew Yglesiasの意見：「自分でvibe codingするより、 プロがAIを使って作った製品を利用したい」
- 専門家による管理・運用の重要性

SaaSとエンタープライズ導入の信頼基準

サイドプロジェクトやSaaS導入時の 信頼性判断基準
- 数週間自分で使い込んだ実績が価値
- エンタープライズでは、 他社での長期間運用実績 が重要
実績と信頼性 の証明が導入判断の鍵

Hackerたちの意見

未来の人たちは、30年後に私たちが何を考えていたのか、マジで不思議に思うだろうね。LLMが生成した数十億行のコードがごちゃごちゃになって、人間がほとんど読んでないし、誰もメンテナンスできなくなる。LLMが生成したゴミが、今まで存在した良質なコードを埋もれさせてしまって、ネット上で人間が書いたコードすら見つけられなくなるんだ。プログラミングを永遠に諦めたくなるよ、もうコンピュータも使いたくない。

└

その時には、修正は簡単だろうね。最新のLLMを立ち上げて、自分のコードベースを指して「これをゼロから書き直して。ちゃんとやって。アーキテクチャのミスを直して」と言えばいい。

└

まず、ほとんどのソフトウェアはすでにごちゃごちゃしてる。次に、LLMが生成するコードは、人間が書いたコードよりもごちゃごちゃしないこともあるよ。ちゃんとトレーニングやプロンプト、検証、レビューをすればね。完璧でパターン化されたSOLIDでユニットテスト済みのコードを、警告やアンチパターンなしで生成するのは、今までで一番簡単だよ。

└

一般的に「LLM支援のコーディング」には賛成だけど、時々『デューン』のバトラー・ジハードのことを考えるよ。 https://en.wikipedia.org/wiki/Dune:_The_Butlerian_Jihad

└

アセンブリプログラマーから現代のJavaScriptの人たちへ、こんにちは。冗談はさておき、VS Codeがこんなに層になって書かれてるのを考えると、時々驚くよね。約200MBのミニファイドコード - JavaベースのIDEは、ほぼ1GBのコード（ライブラリや依存関係）でさらにひどかった。VS Codeはその時代のネイティブエディタ（Sublime）を打ち負かして今は支配してるけど、ビジネスモデル（オープン＆無料 vs フリーミアム）が影響してるかもね。でも、個人的にはかなりうまく機能してると思う。これによって、何十億ドルのスタートアップが市場に出てきたし、CursorやAntigravity、ほぼすべてのUIコーディングエージェントも含まれてる。バックエンド開発者（Java/C++系）が、まるで私たちが劣った惑星から来たかのようにJavaScript開発者を見下してたのを覚えてる人はどれくらいいるかな？VSCodeが実際にはネイティブフレーム内にラップされたブラウザだってことを覚えてる人はどれくらい？

└

30年後もまだコードを見たり、メンテナンスしたり、ちょっとでもコードについて心配しなきゃいけないなら、何かが深刻におかしいってことだよね。

└

何年も盲目的にこの方向に進んで、突然みんなで目を覚まして「何をしてしまったんだ」と気づくのは間違いだと思う。これは素晴らしいフィルターであり、素晴らしい機会でもある。もしLLMがここ数年のペースで改善を止めたら（もうすでに遅くなってると思うけど）、それでも数十億行のコードを生み出すことができるけど、自分たちではgrepもできないし、論理的に考えることもできないから、品質が落ちて、LLMに全力投球する企業は収益を失うことになる。でも現実的に考えよう。現代のLLMは、正しく使えばまだ素晴らしくて役立つツールだから、残るだろう。私たちの目標は、彼らを正しい方向に導いて、幻覚の悪影響を減らすことだよ。その結果、ソフトウェア業界は、何百万もの機能がある大規模で複雑な相互接続システムから、少数の機能が積極的に使われる小さく高品質なターゲットツールへと移行するだろう。なぜなら、その方が検証しやすく、副作用をコントロールしやすいから。

└

なんでみんなのコードが品質の基準みたいに振る舞ってるの？ほとんどのソフトウェアは、もうめちゃくちゃだと思うよ。考えもなしに、ましてや超考えなんて。

└

LLMがあってもなくても、誰も維持することはもう不可能だ。それがテクノロジーの神官たちの役割なんだ。

└

30年後、人間は気候管理されたベッドで目を覚まし、理想的な大規模な人間動物園で、何の情報が欲しいか考える。そして、彼の900TBのフェロエレクトリックコンピュートインメモリーエクソブレインが、脳-コンピュータインターフェースを通じて彼の思考を読み取り、その情報のカスタム3Dビジュアライゼーションを彼の前に浮かべる。コードの段階はなく、データをピクセルに神経的にレンダリングするだけだ。

└

Githubのバイブコーディングプロジェクトには慣れないな。ちょっと使ってたプロジェクトは約1年前のもので、40,000コミットと15,000PRがあった。名前に「lite」がついてて、シンプルな代替品のはずなのに、バグがめちゃくちゃ多かった。1つ直してPRを出したけど、数時間で1ページ目から消えちゃった。絶対にマージされないだろうな。もう少し「速度」が少ない別のプロジェクトに移ったら、すごくスムーズだったよ。

もしかしたら、数週間分の進展を見逃してるかもしれないけど、AIがもっと信頼できるようになったとは思えない。エラーがただもっと微妙になっただけだよ。コードがコンパイルしなければ、それは簡単に見つけられる。コンパイルはするけど動かない場合も、まだ見つけやすい。コンパイルもして動くけど、エッジケースで間違ったことをする、セキュリティの脆弱性がある、技術的負債や疑わしいアーキテクチャの決定を引き起こす場合は、見つけるのが難しいけど、レビューの負担は全く減らないよ。むしろ、「真実らしい」コードは、明らかに悪いコードよりもレビューが精神的に疲れる。

Hacker Newsで議論の続きを見る

ハクソク