世界を動かす技術を、日本語で。

ガスタウンのエージェントパターン、デザインのボトルネック、そしてスケールでのバイブコーディング

概要

  • Steve Yeggeの「Gas Town」は、複数のエージェントを同時に動かす異色のオーケストレーションシステム
  • 設計や実装は即興的かつ非効率で、APIコストも高額
  • ソフトウェア開発の未来像を問う「デザインフィクション」として注目
  • 設計と計画が新たなボトルネックになることを示唆
  • カオスの中に将来のエージェントオーケストレーションのヒントが隠れる

Gas Town現象と評価

  • Steve Yegge による「Gas Town」は、 Mad MaxWaterworld などをモチーフにした エージェントオーケストレーター 開発
  • 完全に vibecoded (雰囲気重視・即興設計)で、APIコストが月数千ドル規模
  • ソフトウェアエンジニア界隈で 議論と変化 を巻き起こす
  • $GASという ミームコイン がBags上で登場し、$400,000超の取引高
    • Gas Town本体とは無関係な 純粋な投機対象
  • 「実用的なツール」ではないが、 ソフトウェア開発の未来像 を投げかけるデザインフィクションとして評価

デザインフィクションとしての意義

  • デザインフィクション とは、近未来のありそうなものを作り、 問いや議論 を生む手法
    • 予測ではなく、 日常的な不便や副作用 を考える
    • 詳細はNear Future Labの解説やManual of Design Fictionを参照
  • Yeggeは 不完全なプロトタイプ を公開し、議論を促進
    • 「自分には作れたが、他の誰もやらなかった」精神

Gas Townの実用性と体験

  • 筆者自身は 本格利用経験なし
    • Yeggeの「自作ツール使うな」という警告に従う
    • ユーザー体験は 混沌とカオス
  • Yeggeの「8段階自動化レベル」では、Gas Townは最上位の オーケストレーター運用
  • Onboardingは 極めて難解 で、設計思想がYegge本人にしか合わない

エージェント開発の新たな課題

  • エージェントがコードを書く時代、 設計と計画 が最大のボトルネック
    • 実装よりも「 何を作るか」「 どう設計するか」が重要
    • 人間の 文脈・好み・ビジョン が不可欠
  • Gas Townは設計が「 思いつきの連続」で、体系的な構造がない
    • 17日間で75,000行・2,000コミットという 突貫開発
    • 「Beads」プロジェクトの延長線で、 設計不在のまま規模拡大

将来のエージェントオーケストレーションへの示唆

  • 現状はカオスだが、 将来のエージェントシステム のヒントが埋まる
  • エージェントに 専門役割階層的監督構造 を持たせる設計
    • 例:Mayor(人間との窓口)、Polecats(一時作業員)、Witness(監督)、Refinery(マージ管理)
    • 各エージェントが 明確な役割 を持ち、 指示範囲を限定 し、同時多発的な運用が可能
  • Mayorが全体を統括し、直接コードを書かずに 作業割り振り を担う
  • システム内の 監督エージェント (Witness, Deacon, Boot the Dog等)が作業進捗を随時確認
  • 役割設計と階層構造 による協調・注意力問題の解決

まとめ

  • Gas Townは「 設計なきカオス」だが、 未来の開発環境 を考える上で重要な実験場
  • 人間の設計力・計画力 が、エージェント時代の新たな必須スキル
  • 現状のGas Townは「 Yeggeの脳内にしか合わない」が、今後のエージェントシステム設計の 原石 となり得る

Hackerたちの意見

「ガスタウン」について学んだことは、全部自分の意志に反してる。

バイブコーディング、ラルフ、ヨロモードの創造者(抽象的に)によって提供されています。現実の見方を解体するための陰謀か、ただの面白い言葉を作る傾向か。

Yeggeの承認を得て、暗号通貨のポンプ・アンド・ダンプ詐欺に移行した部分、見逃した? それに、「Ralph」のvibe codingをやってたやつが、同じ詐欺を支持してたんだよ。彼は元々暗号通貨の批判者だったはずなのに、どうしてそんなことを?

最初は、ガスタウンはGOODY-2みたいな高レベルの風刺だと思ってたけど、どうやらみんなちょっとおかしくなってるみたい。ラルフループも無駄だよね、kvキャッシュをうまく使ってないし。 --- https://github.com/steveyegge/gastown/issues/503 問題: すべてのgtコマンドがbdバージョンを実行して、最小ビーズバージョンの要件を確認します。高い同時接続(17以上のエージェントセッション)の場合、このチェックがタイムアウトしてgtコマンドの実行をブロックします。影響: 17以上の同時セッションがそれぞれgtコマンドを実行している場合: - 各gtコマンドがbdバージョンを生成 - 各bdバージョンが5-7のgitプロセスを生成 - これにより、リソースを争う85-120以上のgitプロセスが生成される - gtの2秒のタイムアウトが超過する - gtコマンドが「bdバージョンチェックがタイムアウトしました」と失敗する

Ralphループは、kvキャッシュを適切に活用してないから馬鹿げてる。これはコストやリソースの問題だよ。もしもっと効果的でリソースがあるなら、それは全然問題ない。

これはサティアだと思うし、かなり明白なサティアだよね。誰か本気にしてる人いるの?

イェッゲは、ガスタウンのアーキテクチャやワークフローのために、自分でたくさんの華やかで動物的な図を作ったけど、全然役に立たない。主に、全てがジェミニのナノバナナによって作られたから。ナノバナナは図を作るのが最先端だけど、生成AIシステムはまだイラスト的な図を作るのが本当に下手なんだ。解読が難しくて、細かい詳細がごちゃごちゃしてて、矢印が間違った方向を指してることが多く、重要な情報が欠けてることもある。ほんとその通り! それに、図全体にわたる意味不明なテキストや不一致なビジュアルは——読者の知性への侮辱だよね。どうして人々はこんなにスラングのような視覚表現を我慢できるんだろう?

うん、最初はただのイラストとして意図されてるのか分からなくて、しばらくして読むのを諦めちゃった。実際に読みやすいアーキテクチャ図があればすごく助かったのに、文体がめちゃくちゃ難解で、マニックな「楽しい」無礼なスタイルだったからね(独特の声で書くのは面白くするためにはいいけど、やっぱり…混乱する)。それに、数段落ごとに新しいユニークな名前やつながりが出てきて、頭に入れるのが大変だった…最初にGemini 3 Proに退屈な技術的概要にまとめてくれって頼んだら、元の投稿と同じくらい理解不能な1ページのアウトラインとマーメイド図を作ってくれたから、AIでも消化するのが難しいみたいだね…

イェッゲはこのプロジェクトでバイブコーディングの真の定義に寄り添っている: 「これは100%バイブコーディングだ。コードを見たこともないし、見る気もない。」意味がわからない。自分がやっている仕事のタイプをよく理解していて、コードの事前知識もあるのに、非常に仕様がしっかりした問題でも、クロードコードなどは単純に失敗するか、雑なコードを使ってる。業界の人たちは、225K行以上のコードの一部を見たことがないのに、それが動くと約束するのはどういうこと? 誰も理解できないコードの海が生まれる時代に突入している気がする。それをAGIが掃除してくれることを期待してるけど。

この見解には共感するけど、アセンブリ言語プログラマーがコンパイラについて言ってたことと同じことなんじゃないかとも思う。機械語を見ないってどういうこと? コンパイラが非効率なことをする可能性は?

誰も何も約束してないよ。ただの巨大な実験で、著者は明確に使わないように言ってる。新しいことに挑戦する人には感謝してる、たとえそれが壁に糞を投げて何がくっつくか見るようなことでも。もしかしたら、私たちのコーディングの仕方が変わるかもしれないし、変わらないかもしれない。バイブコーディングは、確かに役立つツールを作るのに助けになった。

俺も同じ経験があるよ。 vibe codingを試みたら、いつもオフバイワンエラーや論理エラー、間違った仮定の繰り返しとかに悩まされてきた。最初はうまくいってるように見えるけど、コードレビューで見るとすぐにバグが見つかるし、実際の使用では軽いものでも問題が出てくる。手動で修正することはできるけど、労力はプロジェクトの規模によって変わるね(小さいプロジェクトなら簡単に修正できるけど、大きいプロジェクトだと「自分で書いた方が楽だったな…」って感じ)。Gas Townの多層的な監視機関は、この手動の修正を置き換えるためにあるんだろうけど、ほんとに? みんながこんなもので成功してるってどういうこと? 俺が間違った使い方してるのかな? もし本当に成功してるなら、AIが開発・維持してるオープンソースプロジェクトが、AI管理のシステム以外に存在しないのはどうして?(それともあるけど、俺が知らないだけ?)

AIができることとできないことについての不誠実さにはインセンティブがあるよね。OpenAIの人たちは、GPT2がAGIを達成したって言ってたし、そういう発言をすることには明確なインセンティブがある。実際にAIを使ってるユーザーにとっては、最高のAIでも一発で全てをこなせるわけじゃないってのは明らかだし。最悪なものだと、昨日Geminiを使ったら絵文字を出し続けて、Grokを使ったら「システムのプロンプトで禁止されてるからコードスニペットは出せない」って言われた。何を言えばいいのか分からないよ。理解してないコードベースで作業したい人がいるのも理解できないし、何か問題が起きたらどうするの? でも、こういう主張をすることには大きな経済的インセンティブがあって、他の人もそれに乗っかることがあるから、キャリアに良い影響があるんだよね。俺の会社でも、上の人たちが明らかに使ってないし理解もしてないものを無理やり取り入れようとしてるのを見たことがある(これはエンジニアリングの話で、マネジメントではないからね…理解すべき人たちが理解してない)。素晴らしいツールだけど、コードを見ずに100% vibe codingするのは、他の人に使わせることを期待してるなら悪いアイデアだね。パフォーマンスアートみたいに感じる。ジョークも好きだし、コーディングも好きだけど、両方を混同しないでほしい。

そんな悪い結果が出てる君たちが理解できない。みんな一発で解決しようとしてるの? エージェントを使って反復してないの? エージェント同士を対抗させてないの?(一つはコードを書いて、もう一つはそのコードを批評・テストしてループさせるとか)俺は生成されたコードをちゃんと見てるし、そんなに「vibe coding」にハマってるわけじゃないけど、素晴らしい結果が出てるし、実際にはもうコードを書いてない。だから、最初の段階でLLMが俺の機能を作ってくれるし、確かに書き方が悪いコードや重複コード、他のコードの匂いがするものがあるけど、次に別のエージェントにレビューさせて、その問題を見つけさせる。で、そのレビュー結果を機能を作ったエージェントにフィードバックする。バンバン、きれいなコードができる。Gas TownやRalph Wiggum($$$)は使ってないけど、ドキュメントを読んで、どう動くかを見てるから、全体がどう結びついてうまく機能するかが分かる。彼らは俺がやってるレビューと反復のループを自動で行うように作られてるんだ。

どうしてこの業界の人たちは、225K以上のコードの一部も見てないのに、それがちゃんと動くって言えるの?約束されてるのは、顔が引き裂かれることだけだよ。「警告 危険 注意 - さっさと逃げろ - お前は死ぬぞ […] ガス・タウンは超知能のロボ猿が働いてる工業的なコーディング工場で、気が向いたら一瞬でお前のものをぶっ壊すことができる。彼らは他の猿や作業台、顧客も壊すだろう。経験豊富な猿使いじゃないなら、顔を引き裂かれるぞ。」

誰がちゃんと動くって約束してるの?これは限界を探るための実験だよ。もしかしたら、実験がLLMの限界を超えてるから失敗するかもしれない。どこまで進むかで何かを学べるかもしれないし、LLMが進化するにつれて変わるかもしれない。あるいは、これらの限界を押し広げるための欠陥のあるアプローチかもしれない。

必要なときに「スーパーポイントボタン」はどこにあるの?YES!バイブコーディングツールが出てからずっと遊んでるよ。「遊んでる」っていうのは、良いものを作ることができたのは稀だから。サブスクリプションがあるから使い続けてるけど、「すべてのAIは悪い」っていう古臭い考えに陥らないようにするためでもあるし、これらのツールの価値について正当に話せるようにするためでもある。クロードコードは本当にクールだし、ターゲットを絞った計画的なタスクを使えば、貴重な成果を出せる。間違いない。でも、フルバイブコーディングを試みるたびに、どこかで引っかかってしまって、手動で修正しなきゃいけなくなる。私の経験は大体こんな感じだ。1. 最初のプロンプト:おお、これはすごい、未来だ! 2. 二回目のプロンプト:ちょっとだけ追加/調整しよう。 10. 10回目のプロンプト:うわ、1つ直すたびに別のが壊れる。何が「間違ってる」のか全然わからない。エージェントを無理に動かそうとしても上手くいかないし、もしかしたらコントロールを手放すのが苦手なのかもしれない。でも、結局のところ、ガスタウンのようなものがバイブコーディングできたことに驚いてる。もしかしたら、LLMが達成したことを誇張してるだけかもしれない(典型的だし)、もし中を見たら、実際には言ってることの1%しかできてないかもしれないけど、本当にわからない。明らかに何かはやってるけど、私はここでMCPを使ったシンプルなエージェントを作ろうとして、LLMエージェントフレームワークを使ってるのに、数回の反復でつまずいてしまう。

私の経験では、何を作るかと、LLMにどうプロンプトを与えるかによるね。あることにはLLMはすごく良いけど、他のことには本当にクソみたい。まだ初期段階だし、何かを知ってるって主張してる人は、実際にはそうじゃないか、言ってることが1ヶ月後には古くなってる(私も含めて)。

イェッゲは、こういうシステムに挑戦してエージェンシーを行使したことを称賛されるべきだ [...] それから、飛行中のクソみたいな、半分しかできてない飛行機の公開ツアーを実施している。この引用は私にとって全てを要約している。会話を前に進めるクレイジーなプロジェクトで、私が見ている主な価値だ。運が良ければ、投入した以上のものを得られるかもしれないけど、かなりの賭けで、確率はあなたに不利だよ。

Gas Townに対する広範な嫌悪感が理解できない。スティーブのレポートを読めば、これは大きな楽しい実験だってことが分かる。境界を押し広げて、技術とアートの混合で、挑発的なんだ。確率的ニューラルネットを使って、奇妙な方法で組み合わせて、何か一貫したものが出てくるか試してる。なのに、反応は「プロフェッショナルじゃない」「真剣じゃない」「生産準備ができてない」って腕を組んで不満を言う真面目なエンジニアたちばかり。俺は、業界が初期の頃の遊び心や実験精神を失ってしまったように感じる。人々が何がうまくいくか、何がうまくいかないかを試していた時代が懐かしい。もしかしたら、どこかのスーツが「どこにでもニューラルネットを使わなきゃダメだ」って言ってるから、楽しさがなくなってしまったのかも。大規模なプロフェッショナリズムの自然な結果なのかもしれないし、ストックオプションプランやRSU、レベル、スプリント、PMがあって、今日のグレーのフーディは過去のグレーのスーツのアップデート版だけど、想像力の乾きは変わらない。

スティーブのレポートを読んだら、個人的には12ページの熱にうなされた夢のような内容の中で3段落くらい読んで、「まだ俺には合わない」とファイルした。

アートや遊び心、実験的な要素は、ハイプの波に乗ってるとあんまり魅力的じゃないよね。もっとフォークアート的なプログラミングが見たいけど、ガス・タウンは魅力的なものよりも、むしろクソみたいなBeepleに近い。

人々がこの実験をビジネスの真剣な進展として扱ってるからだよ。

もしかしたら、彼が次に投稿した「人々が彼の奇妙で遊び心満載の熱病の夢に数百万ドルのVC資金を投げようと並んでいる」という内容が人々を不安にさせてるのかも?アートの資金提供には賛成だけど…

スティーブの書いた記事を読めば、これは大きな楽しい実験だってことがわかるよね。スティーブは「お前は死ぬぞ」みたいな怖いことも言ってるけど、こんなことも言ってるんだ。 > 「次に何をするか、先に進めてみたよ。3月に『ジュニアデベロッパーの逆襲』で予測したんだ。誰かがクロードコードのキャメルを組み合わせて戦車にするって。で、実際にガスタウンでそれをやったんだ。20〜30個を一度に、持続的に生産的に使えるように調整したよ。」 「次は何か?」実験じゃないよ。私たちの働き方についての予測だ。「生産的に」って言葉?「生産的に」ってのは、ただの「大きな楽しい実験」じゃないんだ。「生産的に」ってのは、人々が使うべきものがあるときに言う言葉だよ。警告を出してるときでも、「もし少しでも疑問があるなら、使えないよ」って言ってて、正しい人が使う準備ができてるって暗に示してるし、「ガスタウンで効果的に働くには、バイブコーディングにコミットすることが必要だ」って言ってるから、効果的に使えるってことも示唆してる。毎日、ハッカーニュースを見て、誰かのブログで矛盾したメッセージに対する反応を見てるんだけど、もし二つの異なる矛盾したことを言って、はっきり解決しないまま、どちらが最終的な答えかを言わなかったら、言った両方のことについて責められるし、それについて文句を言う権利もないんだよ。自分でやったことだから。

でも、そうじゃないんだ。スティーブ(本を出版して、いくつかのスタートアップでディレクター職にいるから、ちょっとは余裕があると思いたいけど)が、完全にクリプトのポンプアンドダンプを支持することに決めたときに、彼はその溝を越えたんだ。エンジニアリングに関する何かではなく、プロジェクトの視聴者を monetization することに決めたときにね。もちろん、スティーブはそれを理解するほど賢くない(彼自身の言葉で)し、買わない方がいいって勧めてるけど、結局はいい利益を得てる。今やそれはメムコインだ…ソフトウェアプロジェクトが付随してるけど。エンジニアリングに関する何かは、彼がクリプトのクソを否定しなかった日から死んだんだ。エンジニアがクソをクソと呼ばないのはどうなったんだろう。

ガスタウンのモクシーが好きだし、楽しいし、ちょっと皮肉っぽい感じもする。だけど、ガスタウンをオーケストレーションの画期的なものとして持ち上げる人たちが嫌いだ。ラルフについても同じことをしてる人たちが嫌い。正直言うと、無思考で物事に群がる人たちが嫌いで、ソーシャルメディアが言ってることにしか興味がないのが嫌だ。この傾向を考えると、世界の終わりを思い浮かべて、ちょっとワクワクしちゃう。

それは気まぐれじゃないんだよね。気まぐれの裏には、ちょっとした軽蔑が混ざってる感じがする。「ガム一本買ってあげるから、噛み方教えてあげるよ」みたいな、イライラしたトーンがあって、でもそれは直接言わずに「お前らバカだな」って感じで伝わってくる。すごく頭のいい誰かが、その事実を顔に押し付けながら「お前には見えない明白な真実」を伝えようとしてるような、ちょっと嫌な臭いがする。もしかしたら、彼が正しいかもしれないけど、反応はその肩に乗っかってるチップの味が混ざった、楽しい内容の中にあるんだよね。

ガス・タウンについてのスティーブの書き込みのリンク、まだ持ってない人のために: [Mediumの投稿]: https://steve-yegge.medium.com/welcome-to-gas-town-4f25ee16d... [HNのディスカッション]: https://news.ycombinator.com/item?id=46458936

これは無害(っぽい)楽しみだと思ってたけど、デイビッド・ジェラードが投稿して、イェッジがガス・タウンを使って、彼の支持者を裏切るクリプトプロジェクトを進めたって言ってた。彼自身は記憶によると5万から10万ドルの間を持ち逃げしたみたい。技術的な価値とはあまり関係ないかもしれないけど、すごく印象が悪いし、これを推してる人たちが、長い間多くのエンジニアにとって無規制で賢くないように見えてしまう。数週間前に、LLMをたくさん使ってる真剣な大人のショーン・ゴーデッケとランチしたけど、前に出てる人たちの半分は完全にマニックな行動をしてて、みんなそれを応援してるのを見ると、本当に驚くよ。 https://pivot-to-ai.com/2026/01/22/steve-yegges-gas-town-vib...

著者の高価なフローチャートとスティーブ・イェッジのAIアートは、彼の投稿やリポジトリがどれだけ混乱しているかの良い例だよ。でも、これはAIコーディングツール全般に共通する問題だね。驚くことに、これらのツールのクリエイターたちはエージェントコーディングに最も楽観的だから、ソースコードにもその影響が出てる。Claude Code自体も、こんなに広く使われている製品なのに、異常に多くのリグレッションや文書化されていない変更があるみたい。最近、spec-kitやスプライトの詳細をドキュメントから理解しようとしたときも同じ問題に直面した。でも、Gas TownはAIコーディングの未来がどうなるかを示す非常に教育的な例だと思う。成熟したオーケストレーションワークフローが2026年には登場する自信があるよ。

スプライトに苦労してるの、私だけじゃないんだね!

もしそれがバカでも、動けばバカじゃない。ガス・タウンはバカを超越してる。抽象的なゴミ生成器だよ。アートだとか実験だとか呼んでもいいけど、問題の解決策とは到底呼べない。

「バカでも動けばバカじゃない」というのは、結果が根本的に重要じゃない高級な使い方にだけ当てはまる。結果が実際に重要になった瞬間、その格言は「動くけどバカなら、動かない」になるんだ。

ただ、イエッジ氏は注目を求めてるだけなんだよ。彼がいつもそうしてるように。

イエッジは情報のギャップでアービトラージをしてるだけだよ。これはすべてのAIベンダーが利用してる同じ溝で、何が起こっているか少しでもわかっている人と、全くわからないけど興奮や未来への恐怖に中毒になってる大多数の人とのギャップだ。イエッジはそれについて偽りの遊び心を持ってるけど、彼の他の文章を読んだことがあるなら、これが一致してることがわかる。彼は挑発やいたずらを少し高く評価しすぎてるから、あまり真剣に受け取るべきじゃないけど、考える価値のあるアイデアもいくつかあるよ。

ガスタウンについてのコメントがたくさんあるね(それはわかる、話さざるを得ないよね!)、でもこの記事は結構良いと思ったよ。いろんな質問をまとめて、考え方を提案するのが上手だった。特にこの部分が好きだな。 > より保守的で、考えやすい議論は、エージェントソフトウェア開発ツールのコードはどれくらい近くあるべきか?アクセスはどれくらい簡単であるべきか?開発者が手動で編集することをどれくらい期待するか? > この議論を「どちらか一方」って枠にはめるのは役に立たない。コードを見るか見ないか、手動でコードを編集するかエージェントを指示するか、アンチAI純粋主義者かエージェント最大化派か、っていうのは役に立たない。 > 正しい距離は、あなたがどんな人か、今のAIの能力について何を信じているかに関するものではない。どれだけ文法から離れるかは、あなたが何を作っているか、誰と作っているか、そして物事がうまくいかないときに何が起こるかによって変わる。