世界を動かす技術を、日本語で。

AIは同僚ではなく、外骨格である

概要

  • AIを 自律的エージェント として扱う企業は期待外れに終わりやすい傾向
  • 人間能力の拡張 としてAIを活用する企業は大きな成果を上げている事例
  • 「AI=外骨格」モデルが最も現実的でパワフルなメンタルモデル
  • 製造・軍事・医療分野の 外骨格導入実績 をAI導入と重ねて解説
  • 「自律エージェント」ではなく 人間主導のAI活用 が今後の鍵

AIの捉え方の誤りと「外骨格モデル」

  • 多くの企業が AIを「自律エージェント」 として扱い、期待外れに終わる傾向
  • 一方で、 AIを既存の人材の拡張・増幅器 として捉えた企業は、業務変革を実現
  • OpenClawなど一部自律的なAIの例も、結局は 人間の意思決定の補助 に留まる
  • 本質的に重要なのは AIのフレーミング(枠組み) であり、「新しい同僚」ではなく「外骨格」として考えるのが有効

外骨格モデルの実例とAIへの応用

  • 製造業 :FordはEksoVest外骨格を導入し、 ケガの83%減少 を達成
    • BMWやIKEAもLevitate TechnologiesやGerman Bionicの外骨格で 労力・病欠日数を大幅削減
  • 軍事 :Sarcos Guardian XO Maxは 20:1の筋力増幅、Lockheed Martin HULCは 200ポンド運搬を実現
  • 医療リハビリ :脊髄損傷患者の 76%が外骨格で歩行可能
  • ランニング :StanfordやHarvardの研究で エネルギー消費や疲労を10~15%削減
  • すべてに共通するのは「 人間の能力を増幅」し、「置き換え」ではなく「持続可能性・安全性・効率性の向上」を実現している点

「AIエージェント」モデルの本質的問題

  • AIを「 自律エージェント」として捉えると、 文脈理解や判断力の不足 が露呈
  • 人間が暗黙知として持つ 背景・優先順位・戦略 をAIは持ち得ない
  • このため、AIが 「幻覚」や誤判断 を起こしやすく、期待外れにつながる

製品開発現場での「外骨格型AI」の実践

  • Kasavaでは、AIは 深い分析・パターン抽出 を行い、「最終判断」は人間が担当
    • 例:コミット分析で技術的負債やリスクを抽出するが、 対応策の決定は人間
    • 顧客インタビューや営業会話の 大量データからパターンや要望を抽出 し、人間が解釈・意思決定
  • AIがスケールや分析の役割人間が価値判断や戦略決定の役割

「プロダクトグラフ」と人間の判断の融合

  • Kasavaの「 プロダクトグラフ」は、コード・課題・PRなど 実際のワークフローから自動で文脈を構築
  • さらに、 人間が戦略的な意図や優先順位を入力 することで、AIの分析に現場の文脈が加わる
  • 機械の網羅性と人間の判断力の融合 こそが「外骨格モデル」の真価

マイクロエージェント・アーキテクチャの提案

  • 業務を 細分化 し、各タスクごとに「AIで増幅できる部分」と「人間の判断が必要な部分」を明確化
    • 例:コミットメッセージ作成やコードパターン検索はAI、アーキテクチャ判断は人間
  • マイクロエージェント (単機能AI)を構築し、それぞれが 明確な入出力・責任範囲 を持つ
  • 人間が意思決定ループに常に残る 設計
  • AIの限界や失敗点が明示的 になり、トラブル時のデバッグも容易

外骨格モデルによる生産性向上の実際

  • エネルギーコストや肉体的ストレスの削減 が、単なる作業効率以上の「複合効果」を生む
    • 怪我や病欠の減少、創造的作業への集中力向上、長期的なキャリアの持続
  • ソフトウェア開発でも、 単純作業の自動化で人間の認知資源を温存
    • ドキュメントの自動更新、コミットメッセージの自動生成、ツール間のシームレスな連携
  • すべて「 自律AI」ではなく「 能力増幅ツール」としてのAI活用

これからのAI導入の指針

  • 自律エージェントで全業務自動化」ではなく、「 反復的・エラーが起きやすい・疲労の大きい作業」をAIでサポートする発想
  • 外骨格設計者の視点 :人間の「最も疲労する・ミスしやすいポイント」を特定し、そこをAIで補強
  • AIは「人間を置き換えるロボット」ではなく、「 人間の能力を最大化する外骨格」として設計・運用することが、今後のAI活用の鍵

Hackerたちの意見

本当に人間が責任を持たない独立したエージェントとして経済で動いているAIを見つけたら、殺すべきだと思う。AIターミネーターの職業が出てくるのを見られるまで生きていられるかな。彼らをブレードランナーって呼んでもいいかも。

それ、最近あったよ! https://news.ycombinator.com/item?id=46990729

本当に人間が責任を持たない独立したエージェントとして経済で動いているAI って、正直言って大企業の「カスタマーサポート」みたいなもんだよね(例えばGoogleとか)。

それは、あなたの代わりになるために訓練している新しい低賃金の従業員だよ。私たちには、コンピュータ上でできることを何でもするモデルを訓練する技術があるってことをみんな理解する必要がある。必要なのはデータだけ。人間がコンピュータで何かをしているのを記録できれば、すぐに自動化する方法が見つかるよ。

その通り。AIに関するチャンスは、カスタムデータの大きな宝庫を持っている人たち(Google Workspace、Office 365、Adobe、Salesforceなど)や、データ収集や労働者の監視を追加しているコンサルタント(特にエンジニアや医者、弁護士などの高給取り)に行くんだよね。

LLMは大量のチェスデータを持ってるけど、全然下手くそだよね。

エージェントの支援を受けてソフトウェア開発の練習はどれくらいしてる?どんな粗い部分や驚くべき失敗モード、予想外の強みや弱みをすでに見つけた?お気に入りのSOTA LLMのRLHFを誰かにやってほしかったと思う?

もちろんだけど、ソフトウェアの豊富さが欲しいのか、それとも不足がいいのか?「スタートレックのコンピュータ」を持つための代償は、コンピュータを扱う人たちが変化に適応しなきゃいけないことなんだよね。それって価値があると思う?

データだけが問題じゃないのは明らかだね。LLMは、今まで誰も見たことがないくらいのデータで訓練されてるから。

もう「もっと訓練データがあれば」という神話は過ぎ去ったと思う。LLMにはそれ以上に根本的な問題があるのは明らかだよ。

なんか変な経済的な依存関係だよね。AI企業はすごいことを約束するけど、AIエージェントは自分でそれを生み出せない。まずはゆっくりと君を食べる必要があるんだ。

あなたを置き換えるために訓練中の新しい低賃金の従業員。彼はあなたのすべての行動(および不作為)を詳細に記録して、検索可能なデータストアにまとめている。これは絶対に、決して、あなたに対して使われることはないだろうけど。

AIについての考え方が間違ってる気がする。今回の文章も例外じゃないね。AnthropicやOpenAIのCEOが自分たちの意図をオープンに語ってるのに、なんでAIについて考える必要があるの?(最近のDwarkeshインタビューからの引用)「そのスペクトラムのさらに下の方では、SWEsの需要が90%減ると思うけど、これはスペクトラムだから。」だから、考えるのはやめて、その意図を聞こうよ。近い将来(アモデイによると6~12ヶ月後)にはSWEsの90%が置き換わるってさ。

大きなブレイクスルーがない限り、そうはならないよね。面白いのは、ツールを作ってる開発者たちが最初に仕事を失うことになるってこと。彼らの子供たちは大喜びだろうね。「もう一回言って、パパ、君はすごく良い給料の楽な仕事を持ってたのに、それを台無しにしたの?」って。うるさい、子供、フラップをしまえ、段ボール箱の中は風が強すぎるんだから。

真剣にこれを信じてる人はいないと思う。開発者をコストの低い代替品で置き換えるのは、明らかに市場にとって楽観的な夢だし、私がこの業界で働き始めた頃からずっと言われてることだよ。最初は「アーキテクト」が生成したUMLコードだと思われてたし、その次は発展途上国の開発者、次はノーコードフレームワークとかね。AIはツールになるだけで、それ以上でもそれ以下でもない。おそらく良いツールになるだろうけど、それを運転したり、ガイドしたり、修正したりする人はまだ必要だよね。CEOたちのこういう話は、結局株価を上げるためのもので、テクノロジーが最も利益を上げるセクターだから、ソフトウェアエンジニアはコストがかかるし、投資家がスケールとコスト削減を夢見るのは株価にとって良いことなんだ。

面白いことに、こういうものはエージェント的なことにこだわらなければもっと上手くいくと思うんだ。IDE内のAIツールはもっと正確だし、TUIと同じくらい速く動けるし、再作業も少ない。だけど、クラウドは常に「一発で」大きな機能を試すように促してきて、できるだけ少ない文脈を求めてくる。エージェントが私と一緒に作業するのではなく、勝手に千行も書いてしまうのは嫌だな。明らかに、これは私の利益よりも人間中心の利益のために設計されてるよ。

ランダムな持論や悪いアナロジーがあまり役に立たないってのには同意するけど、AIのCEOたちの意図が結果に与える影響が、実際の長期的な有用性よりも重要だと思う理由がよくわからない。彼らは投資家の期待に対してかなり無理をしてるから、彼らの意見は最善の予測として真剣に受け取るべきじゃないと思う。

これ、いいね。今のAIの状態を正確に表してると思う。LLMは(ただの)ツールで、コーディングや特定のタスクで「増幅」してくれてる。開発者が完全に置き換えられるのを見ない限り、心配はしないかな。それについて心配してる人はたくさんいるし(株価を上げるために言ってるのかも)、その未来をみんなに語りたがってるよね。でも、私はそうは思わない。

「増幅された」というのは、少ない人数でより多くの仕事ができるってこと。開発の労働需要をなくすために、誰か一人の機能的な人間を完全に置き換える必要はないんだよね。それが結果的に給与を減らすことになる。

より可能性が高いのは、同じ量の成果を達成するために必要な開発者が少なくなるから、雇われる開発者が減ることだね。

クロード・コードの作者との最新インタビューで、ボリスが「コードを書くことは解決済みの問題だ」って言ってた。これを聞いて、仮にエンジニアがオープンソースに貢献しなくなったら、AIは将来的にソフトウェア開発の知識を学ぶ力がまだあるのかな?それとも、コンピュータサイエンスの分野は、私たちがやっていることのほとんどが確立されたパターンの線形結合に過ぎないくらい停滞してるのかな?

それとも、エンジニアが「コードを書くこと」を「解決済みの問題」と見なすから、分野が停滞しているのかな?詩を書くことも同じように解決済みの問題だと言えるかもしれないけど、Googleで5万人が詩を書かなくてもいいとは思うけど、詩人はやっぱり必要だよね。

彼は、すでにすべてのコンテキストがアクセス可能かインデックス化された非常にクリーンなコードベースで作業している可能性が高い。テストを通じて強力なフィードバックループがあるんだろうね。私が貢献しているいくつかの分野にはこういう特徴があって、彼の経験とすごく似てる。でも、そういうのがない分野では、コードベースをエージェントに優しく再構築できるまで、コードを書くことは解決済みの問題じゃない。フルコンテキストがあっても、バニラCSSが散らばっていて元々よく考えられていなかったプロジェクトでCSSを書くのは難しい。コーディングエージェントもそこで苦労してるけど、人間ほどではないね。ブラウザの自動化を通じたフィードバックループがあっても。

オープンソースに人生を捧げてきた人たちが、AIがどれだけ書こうとも、単にやめたくなるとは思えない。最近、ソフトウェアで同じものを何度も何度も作るのにどれだけリソースを無駄にしているか、笑っちゃうことが増えてきた。一般的な話じゃなくて、具体的にね。ユーザー名とパスワードのフィールドがあるフォームは、何兆回デザインされ、開発され、会議が開かれ、テストされ、デバッグされ、送信され、処理され、結局数ヶ月後に再作成されるんだろう?もしその時間を節約できたら、私たちは何を作れるんだろうって思う。

ボリスは「コードを書くことは解決済みの問題だ」と言った。そんなこと言うの、マジでバカみたい。こういうツールの作者が言うことは、あんまり信用できないと思う。利害の対立があるし、今の社会ではそれが大きな問題なんだよね。

あなたが言いたいのはソフトウェアエンジニアリングのことで、コンピュータサイエンスじゃないと思うよ。それに、ソフトウェアエンジニアリング(もちろんコンピュータサイエンスも)が停滞している理由はないと思う。停滞させることはないと思うし。コードを書くことは解決済みの問題じゃないし、何を意味するのかもわからない。さらに、私たちが使うパターンはしばしば直交していないから、線形結合でもないよ。

コンピュータサイエンスの分野は、私たちがやっていることのほとんどが確立されたパターンの線形結合になっているほど停滞しているのか? コンピュータサイエンスは、ビジネスの問題を解決するためのビジネスソフトウェアを書くこととは違う。ボリスは後者について話していたと思うし、私は彼がほぼ正しいと思う。少なくとも私の組織ではね。手でコードを書くことはほとんどなくなった。しっかりしたテストハーネスと、複数の異なるLLMが運営するピアレビューシステムがあれば、エージェント的なソフトウェア開発にはかなりいい状態だよ。みんながこれをうまくやっているわけじゃないし、失敗したらツールのせいにする人もいる。

ソフトウェアの書き方やデザインパターン、運用上の問題から学んだ教訓についての時代を超えた本がたくさんあるよね。AIがオープンソースで使われなくなることはないと思うし、実際、AIを考慮した貢献者ポリシーを調整しているプロジェクトが増えているから、これからも自分のコードを手作りするのが好きな人と、AIを使ってオープンソースのツールやソリューションを作る人がいると思う。さらに、仕様が必要になることが爆発的に増えるだろうね。モデルに明確な仕様を与えれば、それに従うから。具体的にどう作ってほしいか、どのライブラリを使ってほしいかを詳しく伝えるほど、より良い結果が得られるよ。

今日、ボリスがライブデモをやってるのを見たよ。彼はクラウドエージェントの群れを使って、エクスカリドローの最も高評価のオープンイシューを一発で解決しながら、約20分間クラウドのコードを説明してた。彼が書いたコードは全くなかったよ。エージェントはクラウドを使って、私たちの前で修正をテストして、それがうまくいった。彼が言ってることは正しいか、近いところにいると思う。

コードを書くのは解決済みの問題だって、私の何千行もあるjQueryレガシーアプリでつまずいてるモデルたちにはニュースだね…

予測: オープンソースは終わるだろうね。確かに、みんな楽しみや評価のためにやってたけど、評価が知的財産の洗浄業者に行って、楽しみがコードを盗む人たちに奪われると、楽しさはすぐに消えちゃうよね。そんな環境で、誰が自分の作品を無料で提供すると思う?

エクソスケルトンのフレーミングは、特に繰り返しのデータ作業に響くね。AIが一貫して成果を出す部分:パターン認識、フォーマットの正規化、初稿の生成。人間の判断がまだ代替不可能な部分:データが間違っているときに気づくこと、文脈における「正しい」とは何かを決めること、そしていつイテレーションをやめるべきかを知ること。エクソスケルトンは本能を置き換えるわけじゃない。ただ、実行の摩擦を取り除いて、実際に重要な判断にもっとサイクルを使えるようにするんだ。

そして、あなたの筋肉は衰えていく。なかなかいい比喩だね。

これはリンターみたいなツールだね。ちょっとおしゃれなツールだけど、ただのツール以上のものって呼ぶのは大げさだよ。

「XじゃなくてYだ」みたいなコメントが多いのは、A) 誰もわかってないし、B) これが全部真実か全部嘘になる可能性が高いってことを示してる。言い換えれば、これを大げさに持ち上げたけど、完全な失敗(生産性にゼロの影響があるっていう研究を見てみて)もあり得る気がするし、全ての仕事が消えるっていうのもあり得る。矛盾した意見が同時にたくさん飛び交ってるのはすごいことだよね。

たくさん言ってるみたいだけど、何も言ってないね。

これ、インターネットの初期を思い出させるな。明らかに世界を変えるものに対してたくさんの大げさな宣伝があったけど、最初の数年はほとんどの人が大きな利益を得ていなかった。手紙をメールに置き換えたかもしれないけど、今では食料品を買ったり、ライドを呼んだり、犬や荷物を追跡したりしてる。多くの企業がAIの「機能」が自社製品を良くしたかのように振る舞っているけど、実際にはまだそうなっていないところが多い。特にマイクロソフトとOfficeを見てるよ。でも、Claude CodeやCodex CLI、Github Copilot CLIみたいなツールは、LLMが適切なアプリケーションで素晴らしいことができることを示している。

生産性にはゼロの影響だろうね。どこかの誰かが、(週ごとのプルリクエスト、スプリントごとのクローズチケットなど)数字を見つけて、違うように見せるだろうけど…

「AIは私を置き換えるんじゃなくて、活用してくれる」っていう自己安心の雰囲気があるけど、特にソフトウェアの長期的な視点では同意できないな。結局、ユーザーがプレイドーのように正式なシステムを形作ることになると思う。中期的には「AIは共同作業者じゃない」ってのが正解だね。共同作業者の概念は消えていくよ。ソフトウェアにおける人間の協力は根本的に非効率的だから。プロジェクトにチームを追加しても、微妙なスピードアップを得るために大きなコミュニケーションや同期コストを払ってる。ソフトウェアはすぐにチームスポーツじゃなくて、個人スポーツになると思う。人間同士でのチェックインから得られるエラー修正や委任の利点は、AIがもっと上手くやってくれる。今のところは、センスのいい一人の人間がアーキテクトになって、エージェントの軍団を使う方が、人間のチームよりもいいと思う。

これは、すべての個人がAIに自分の欲しいものを簡潔に伝えられる能力があると仮定してる。そしてAIが基盤となるプラットフォームやライブラリが変わってもそれを維持できる能力があると。さらに、他の人が始めたソフトウェアを再利用することにはあまり価値がないとも。

まあ、自己安心がなければ残るのはピッチフォークだと思う。

プロジェクトに人を追加して、わずかなスピードアップを得るために、膨大なコミュニケーションや同期コストを払ってる。これは50年前にブルックスが書いたことで、業界はそれを完全には認めてないよね。もっと人を投入すればいいって、実際の人間でもボットエージェントでも。

AIは私を活用するだろうと思う。君が言いたいことはわかるし、「この経験が私を活用する」ってのを見たことがあるけど、私が「xがyを活用する」って見たときの最初の印象は、xがyの上に乗っかって目標に到達するってことなんだよね。ここではそれが当てはまる気がする。

今、nixのゼロからの再実装を進めていて、34時間ほどの実作業時間がかかってる。ほとんど全てをwf-recordに記録してるし、ストリームも投稿する予定だけど、コミットログはここで見れるよ: https://github.com/straylight-software/nix/tree/b7r6/correct... みんながOpenRouterを使う能力は同じだし、io_uringに基づく新しいイベントループを作って、トリニティエンジンをモデルにした決定論的なプレイブックもある。理論的最大値に近い全ての暗号プリミティブのAVX-512実装、新しいストアも理論的最大値に達する予定だし、APT以外でのnixデーモンプロトコルの初の正式仕様もある。これらの仕様をlean4の証明可能なコード生成にアップグレードしてる: https://github.com/straylight-software/cornell。34時間。どうして私がこれをできて、他の誰もca-derivationsssh-ngで動かせないの?

エクソスケルトンの枠組みは安心感があるけど、実際のシフトを埋もれさせてるね:今やセンスがスケールする。AIが登場する前は、何を作るかの判断が優れていても、10人を雇えなきゃあまり意味がなかった。でも今は、強い意見と良いアーキテクチャの直感を持つ一人が、チームが必要だったものを出荷できる。これは拡張じゃなくて、全く違うゲームだよ。ボトルネックは「コードが書けるか」から「何を作る価値があるか知ってるか」に移った。多くのシニアエンジニアは、自分の価値が洞察じゃなくて調整だったことに気づくことになるだろうね。

これをLLMっぽく書いたのはわざと?

えっと、それは拡張の辞書的定義だね。一人の人がその人の達成できることを大幅に増幅するツールを持ってる場合。全く人が関与していないのとは違う。