世界を動かす技術を、日本語で。

数千人のCEOがAIが雇用や生産性に影響を与えなかったと認めた

概要

  • Robert Solow による「生産性パラドックス」の再来
  • AI導入企業の多くで 生産性向上が統計に現れない 現状
  • 経営層の AI期待値と実際の効果の乖離
  • ITブーム時代と同様に 今後生産性が急上昇する可能性
  • AI活用の仕方 が今後の価値創出の鍵

ソローの生産性パラドックスとAI

  • 1987年、経済学者 Robert Solow が「 生産性パラドックス」を提唱
    • トランジスタやマイクロプロセッサの普及後、期待された生産性向上が実現しなかった現象
  • コンピューター時代は至る所に見られるが、生産性統計には現れない」という有名な指摘
  • 新技術が職場に情報過多をもたらし、逆に効率低下を招いた事例

AI導入と現状の生産性

  • 2024-2025年、 S&P 500 企業のうち374社が決算説明会でAIについて言及
    • ほとんどがAI導入を「 ポジティブ」と評価
    • しかし、 全体の生産性統計には反映されていない 現実
  • National Bureau of Economic Research による調査
    • 米英独豪の6,000人の経営層対象
    • 約2/3がAIを利用 しているが、週1.5時間程度の活用にとどまる
    • 25%はAI未利用
    • 約90%の企業が過去3年で雇用・生産性にAIの影響なし と回答
  • 経営層は今後3年で 生産性1.4%増、出力0.8%増 を予測
    • 雇用は0.7%減少予想
    • 一方、従業員側は0.5%の雇用増加を予想

AIの生産性効果に関する研究動向

  • 2023年、 MIT 研究者がAI導入で パフォーマンス40%向上 を主張
  • しかし実際のデータでは 期待通りの生産性向上は未確認
  • Apollo チーフエコノミストTorsten Slok
    • AIは至る所にあるが、マクロ経済データには現れない」と指摘
    • Magnificent Seven(主要ハイテク7社)以外では利益や収益期待への影響も限定的
  • 連邦準備銀行セントルイス支店 の調査
    • ChatGPT普及後、 1.9%の累積生産性成長 を観測
  • 2024年MIT研究
    • 今後10年で 生産性0.5%増 と予測
    • 0.5%でもゼロより良いが、業界の約束には及ばない」との見解

AI普及の障壁と雇用への影響

  • ManpowerGroup の調査
    • 19カ国・約14,000人調査
    • AIの定常利用は13%増加 も、 有用性への信頼は18%減少
    • AIへの根強い不信感 の存在
  • IBM の人事責任者Nickle LaMoreaux
    • 若手採用を3倍に増やす方針
    • AIによる業務自動化で若手雇用減→中間管理職不足→リーダー育成に支障という懸念

今後のAI生産性向上の可能性

  • 過去のITブームでも、 1970-80年代は低迷→1990年代に生産性急上昇
    • 1995-2005年に 生産性成長1.5%増 という実績
  • Stanford Digital Economy Lab ディレクターErik Brynjolfsson
    • 2023年第4四半期GDP 3.7%増、雇用増は18.1万人に留まる
    • 2023年の米国生産性2.7%増 をAI投資からの「収穫期」と分析
  • Mohamed El-Erian (元Pimco CEO)
    • AI普及による「 雇用とGDP成長の乖離」を指摘
    • 1990年代のオフィス自動化と同様の現象
  • Slok はAI効果が「 Jカーブ」(初期停滞→急成長)を描く可能性を示唆
    • 成否はAIが生み出す「 価値」次第と強調

AIとITブームの違い・今後の課題

  • 1980年代のITは 独占的な価格支配力 があったが、AIは 激しい競争 によりツールが安価で普及
  • 今後の生産性向上は AI活用の巧拙 に依存
    • 生成AIを各業界でどう実装するか が決定的要素
  • Slokは「 価値創出はプロダクトそのものではなく、AIの使い方にある」と総括

このように、AIは過去のIT革命と同様に「生産性パラドックス」に直面しているが、今後の使い方と企業の取り組み次第で大きな変化が期待される状況

Hackerたちの意見

https://archive.is/L70Ha

マイクロソフトのコパイロットの試用版をフォーチュン500に含めるなら、絶対にそうだね。多くの大手上場企業はAIの機能に気づいてないし、上層部は怠けてて使うことすらないんだよね。

教えないと、釣り竿で釣りをするのがどれだけ難しいかってことが分かるよね。

100% 今、AIの能力に驚いてる人たちはソフトウェアエンジニアばかりで、超懐疑的な人たちはほとんど他のオフィス仕事をしてる人たちだね。彼らの主なAIとの接点を調べてみると、マイクロソフトのコパイロットなんだけど、今までのAIシステムの中で最もクソな実装だと思う。進歩を重視する人間としては、こういうシステムから恩恵を受けてる人が少ないのを見るのは本当に残念だよ。

ソフトウェア開発にはLLMの自動化に適した単純作業がたくさんあるけど、実際のところ、平均的なホワイトカラーの労働者にとってチャットボットの有用性を過大評価してる人が多いと思う。プロンプトがメール自体より長くなるのに、Copilotにメールを作成させる意味は何なの? ChatGPTにスライドデッキを作ってもらうことはできるけど、スライドデッキはもうすでに作るのが超簡単だし。LLMを検索エンジンとして使うこともできるけど、すでに検索エンジンはあるしね。チャットボットを使ってブレインストーミングするって話もあるけど、自分を説明する負担から解放されて考えればいいだけじゃない? LLMはすごく印象的で柔軟なツールだけど、変革を期待されすぎてる気がする。実際には限られた方法でしか変革をもたらさないんだ。彼らが輝く場所はかなり低レベルで、転写、翻訳、画像認識、検索、明確に指定された問題を既知のAPIを使って解決することなど。これには価値があるけど、期待されているような普遍的な加速剤は見えてこないな。

うちの会社は時代遅れで、今日やっと「AIの使用状況が目立たないようにしないとまずいよ」って言われたところ。少なくとも「おっと、それは無駄遣いだった」って言うのまでに6ヶ月はかかると思うし、下手したら1年かかるかも。(AI市場が先に大きく崩れない限り)

結局、経営陣は全然わかってなくて、AIの使い方を自分で考えろってこと?それに、自分でパフォーマンスレビューを書いたり、目標を設定したりするの?

コンピュータサイエンスの観点から言うと、大きな組織は故障したハードウェア(人間)で動いてる分散システムみたいなもんで、通信の遅延も大きいんだよね。個々の人(CPU)はかなり速いんだけど、会議で時間を無駄にしたり、承認待ちしたり、タスクが並行処理できなかったりするんだ。アップグレードする前に、I/OバウンドかCPUバウンドかを知っておく必要があるね。

両方だと思う。ほとんどの組織には、スティーブ・ジョブズのような人がいないから、製品ラインが活性化しないんだよね。マイクロソフトなんかはそのいい例で、年々出てくる製品がほとんど「まあまあ」って感じ。会議も多いし、特に多くの企業ではチームの便利さのためにさらに増えてる。でも今は、2〜3年前と比べて市場が柔らかくなって需要が減ってる。多くの人を解雇しても収益が維持されているなら、AIが助けているんじゃないかな。ただ、企業では直接売上に貢献しているかどうかが重要なんだよね。

じゃあ、個人が自分で書いた素晴らしいオープンソースプログラムはどこにあるの? AIに助けられているはずの小さなビジネスはどこにあるの?

オペレーション的には、新しいスタートアップはエージェントファーストでの設定に大きなアドバンテージがあると思う。古い人間ファーストのものほど良くはないかもしれないけど、モデルの改善に関してはずっと安くて柔軟だろうね。

もしかして、経験豊富な人たちはL2キャッシュみたいな存在なのかな? そして、課題はそのキャッシュを新鮮に保ち、深くしすぎないことかも。すぐに利用できるインスティテューショナルメモリー(キャッシュヒット)が必要で、CPUの人たちがその瞬間に必要としていることを助けるために。キャッシュがなければ問題は解決できるけど、うーん、すごく時間がかかるだろうね。一方で、キャッシュに悪いデータが入っていると、それは良くない。みんなが本当に何をすべきかを考える代わりに、そのキャッシュからそれを選んでしまうから。

分散システムと組織のダイナミクスを比較するのは面白いアナロジーだね。

うちの会社が最初に開発者にAIを使うように推奨し始めたとき、チームの中で一番のベテランが「コーディングが仕事のボトルネックじゃない」って結構声を上げてたんだよね。実際はI/Oの問題で、同時にいくつものプロジェクトが進行してて集中できてないから、キャッシュの問題もあったりして…それがI/Oの問題をさらに悪化させてるんだよ。

多くのホワイトカラーの仕事は、考えたり話したりすることが大部分を占めてるんだよね… コーディングとは違って、考えることは(以前はエージェントがなかった頃は)消費する時間の中で小さな割合だった。ソフトウェアを書くこと、つまりその考えを実装する方法を考えることは、思考から完成までの全体の時間の中でかなり大きな割合を占めてた。その他のホワイトカラーの仕事(グレーバー的な意味で)は、人と会ったり、「期待を合わせたり」、合意を得たり、スライドやデッキを作ってその考えを伝えたり、市場ポジショニングを考えたりすることだね。Coworkみたいなツールがファイルを見つけたり、チケットを特定したり、情報を引き出したり、Excelの数式を書いたりするのに役立つかもしれない。コーディングと違うのは、ビジネスの観点から見ると、誰もコードの出力を気にしないってこと。コードは決定されたビジネスプロセスの最終目的地なんだ。だから、コードはLLM(大規模言語モデル)の引き継ぎに特に適してると思う。でも、他のホワイトカラーの仕事についてはあまり自信がないな。AIツールはみんなを速く動かすだけだと思う。新機能のリリースを自動化したり、プレスリリースを作成したり、製品を売るために営業電話に出たりするのは(私の意見では)詳細なプロンプトを完全に機能するコードベースに自律的に変えるよりもずっと先の話だと思う。

ルールがあって、非常にあいまいな構文をナビゲートする仕事の場合、AIはそれを自動化するだろうね。1990年代には、コンピュータが非常に正確な構文のルールベースのシステムを自動化してたから。https://hazel.ai/tax-planning このソフトウェア(私は関係ないし、宣伝もしてないけど)は、米国の90%以上のRIAよりも投資計画や税務計画が得意なんだ。RIAを自動化することで、取引ソフトウェアが株式仲介を自動化したのと同じように、RIAの平均手数料を年間1%から0.20%、さらには0.10%にまで下げることができるだろうね。

「スライドやデッキを作ってその考えを伝える」 その使い方は、多くの人がLLMに任せてるよね。でも、これが直線的な生産性の向上に繋がるとは思わない。ほとんどのホワイトカラーの仕事はそんなに速いペースじゃないから、スライド作成に1時間節約しても大きな生産性の利益が得られるわけじゃない。どうするの、同じことについて5つもデッキを作るの? 全てのメールに2回返事するの? それとも自分を褒めて、しばらくRedditをブラウジングするだけ? それに、LLMが生成したスライドには誤りや変なところが含まれてる可能性が高いから、結局は他の誰かが修正しなきゃいけないし、その分あなたの利益は他の人の損失になっちゃう。

どんなソフトウェアエンジニアの仕事が、人と会ったり、「期待を合わせたり」、合意を得たり、スライドやデッキを作ったり、市場ポジショニングを考えたりしないのか、ちょっと混乱してるんだけど。もし前にそんなことをあまりやってなかったなら、どうやってエンジニアリングをしていたのか、思いつくのが難しいな。多くの質問がすでに答えられているようなニッチな技術的な役割を除いて、でもそれでも、そういう話をしているはずだと思うよ。ただ、もっと効率的に、他のエンジニアと一緒にね。

コーディングとは違って、考えるのは(あるいは、エージェント以前は)消費される時間の中で少ない割合だった。ソフトウェアを書くこと、つまり考えたことを実装する方法を考えることは、考えから完成までの全体の時間の中で、もっと大きな割合を占めていた。え?少数派かもしれないけど、考える時間とコーディングの時間はいつも80:20だった。考えて描くのにたくさん時間を使って、あとは一度書いて少しデバッグすれば動く。これってLLMコーディングでもあんまり変わってないよ。ただ、同じだけ考えたら、もっとコードが出力されるようになったけど。

考えることがいつも一番難しい部分で、ボトルネックになってる。プログラミングの中で考えるのが少ない部分だって言うのは、みんなの経験を反映してないと思う。普通の人が、考える量を2倍にしないと質の良いコードを生み出せないなんて、信じられないよ。

明確にしておくけど、この記事はこれを批判してるわけじゃないよ。むしろ、ソロウの生産性パラドックスのおかげで、予想通りのことを示しているんだ。つまり、情報技術は1970年代や1980年代には、コンピュータ化が進んでも経済的な利益を生まなかったってこと。1990年代中頃から後半になってやっと、情報技術が経済全体に明確な利益をもたらし始めたんだ。理由は、ITへの投資が非常に高額で、無駄な努力が多く、全体の経済でコストを上回る利益が出るまでに時間がかかったから。だから、AIも同じようになるだろうと思う。多くの人を助けているけど、ものすごくお金がかかるし、今のところ助けられている人の数は、時間を無駄にしている人やその費用を上回っていると思う。でも、まだ始まったばかりだから、生産性は時間とともに上がっていくし、コストも下がるだろうね。ベストプラクティスと統合する方法を学んでいくうちに。

システムの一部が早く動いても、全体のスピードはあんまり変わらないよね。重要なのは、何かが実行されたかどうかを確認するのが難しくて、作業をするのと同じくらい時間がかかるってこと。もしみんながAIの生産性について真剣に考えてるなら、プログラムの正確さを素早く確認する方法を考えようよ。他のことは、信号待ちの間のフェラーリみたいなもんだ。

コストの面で比較が間違ってる気がする。Claudeのサブスクリプションは、会社に請求される個人アカウントを使うと、1人あたり20ドルだし、Slackみたいな一般的なオフィスツールとあまり変わらないよ。ClaudeやChatGPTに新しい従業員をオンボーディングするのは、1970年代の手動オフィスワーカーに初期のコンピュータの使い方を教えるよりも、めちゃくちゃ簡単だと思う。顧客サービスの自動化みたいな大規模な実装はもっとコストがかかるかもしれないけど、短期的なメリットは十分あると思うから、何かしらの成果は出てくるはず。

この話題について詳しく知りたいなら、ソロウの逆説に対する答えとして、ポール・デイビッドの『ダイナモとコンピュータ』をおすすめするよ。[0] [0]: https://www.almendron.com/tribuna/wp-content/uploads/2018/03...

LLMは生産性の向上に関してコンピュータと似てるとは思わないな。

参考までに、今週のフォーチュンに「一般技術」のJカーブが最新のBLSデータに現れているという記事があったよ。 https://fortune.com/2026/02/15/ai-productivity-liftoff-doubl... スタンフォードが承認した意見のソースはこちら: https://www.ft.com/content/4b51d0b4-bbfe-4f05-b50a-1d485d419... https://www.apolloacademy.com/waiting-for-the-ai-j-curve/

だから、AIが同じように見えることを期待すべきだ。 それはある程度根拠のある仮定なのかな? 2001年に大学でAIの歴史を学んだとき、初期のフレームワークは70年代に書かれていて、2000年までに人間のような知能に達するという予測があったのを思い出す。Samaがこのある種のブレイクスルーを持ち出したからって、今後毎月や毎年同じような改善があるとは限らないよ。もしかしたら、今後10年で人間の知能レベルに達することもないかもしれない。

時間が経つにつれて生産性は上がるかもしれないし、コストは下がるかもしれない。お金はもう使っちゃったけどね。

情報技術が経済全体に明確な利益をもたらし始めたのは1990年代中頃から後半だった。1990年代のブームは主に接続性によるもので、数百万台のコンピュータがインターネットに接続された。 [1] _ 1990年代に。今では、数十億のデバイスが接続されていて、そのほとんどがAndroidデバイスだよ。

それにしても、まだAIの使い方を知らない人が多いのが驚きだよね。ハッカーニュースみたいな技術に詳しい場所でも、現代のAIモデルが動くコードを生成できないと思ってる人がいるんだ。こないだ友達とChatGPTの話をしてたら、質の高い結果を得るためには「思考」をオンにする必要があるって知らなかったんだよ。この友達はアマゾンで働いてた技術者なのにね。まだ使い方を学んでいる段階で、革命的な影響を期待するのは無理だよ。まだまだ始まったばかりなんだ。

へぇ、そんなことに気づかなかった。でも、ずっとそう思ってた。あのVisiCalc以前(あるいはVisiCalc自体)にビジネス用のコンピュータ技術から本当に価値を得ている人がいるのが不思議だったんだよね。全部ちょっと不器用に見えたし。

元の論文 https://www.nber.org/system/files/working_papers/w34836/w348... 図A6(45ページ): 業界別の現在と予想されるAI導入 図A11(51ページ): 業界別の雇用に対するAIの実現された影響と予想される影響 図A12(52ページ): 業界別の生産性に対するAIの実現された影響と予想される影響 これらは、顧客向けや物理的な製品に関わる業界ほど、AIの使用と影響が低いという私の期待と大体一致してる。建設業や小売業なんかがそうだね。「宿泊・飲食」が生産性への影響で4番目に高いのはちょっと驚きだな。どうやって使ってるんだろう。

シンギュラリティに近づくにつれて、物事はもっと騒がしくなって、急速な変化はシステムの中から見ると混沌に見えるようになるよ。みんな、深呼吸して周りを見渡してみて。シンギュラリティが本当に存在するかどうか、AIがすべてを革命するかどうかに関わらず、そんな雑音は忘れちゃおう。周りを見て、物事がより混沌としているように見えるか、予測が良くなっているか悪くなっているか自問してみて。今の予測は、10年前や20年前と比べてどれくらい正確にできる?矛盾する信号がまさに今の状況だよ。一つのアカウントは世界の終わりだと言ってて、別のアカウントは何も変わらない、いつも通りだって言ってる。

シニアエンジニアとしての遅い部分は、実際にコードを書くことじゃないんだ。 - コードのレビュー - ステークホルダーの意見を聞くこと - SDLCの遅延(テストに時間がかかること) - チケット - ドキュメント/図 - プレゼンテーション これらの多くはレビューが必要なんだ。オープンソースプロジェクトでもレビュー地獄は魔法のように終わらないよ。内部でも同じことが起こる。

労働者はLLMを生産性の向上と見なすかもしれないけど、実際は宿題をカンニングするようなもんだよ。CEOとしては、誰かがチェックしなきゃいけない大量のコンテンツが詰まってるのを見てる。テキストベースのシステムに対するDDoSみたいなもんだ。先日、WhatsAppで155ページのドキュメントが送られてきたよ。ありがとう。プルリクエストも同じ。これを誰がチェックするんだ?

誰がこれをチェックするの? その答えは、ある人にとってはもっとAIだって。AIが作成したPRが今は大きすぎて理解が難しいって、同僚が説明してくれたんだ。コードをマージした後にバグが出るんじゃないかって心配してた。彼らの解決策は、別のAIを使ってコードをレビューさせることだった…でも、これじゃコードが何をするのか分からない問題は解決しないよね。彼らはそのための解決策も持ってて…AIにクイズを作らせて、エンジニアに理解度をチェックさせるって。 > 誰がこれをチェックするの? だから、結局のところ本当の答えは…誰もいないってことだと思う。