世界を動かす技術を、日本語で。

企業の95%が300億ドルの生成AI投資に対して「ゼロリターン」を実感

概要

  • 世界中の企業 が生成AIに 数十億ドル を投資
  • 95%の企業 がAI導入による目立った利益を得られていない実態
  • 成功事例は ごく一部 にとどまり、多くは業務効率化レベル
  • AIの限界 と現場適応性の不足が障害
  • 本格的な利益創出や大規模導入は 時期尚早 との結論

企業の生成AI投資と実態

  • 過去3年間で 30~40億ドル 規模の生成AI投資が世界中で実施
  • MITの調査 によれば、企業の 95% がAI導入で「測定可能な成果なし」と回答
  • 成果を大きく得た企業は全体の5%未満 という厳しい現状
  • 多くの企業が ChatGPT、Copilot などの大規模言語モデルを試験導入
    • 80%以上 の大手企業が何らかの生成AIを試行
    • 約40% の企業が実際に導入経験あり
  • しかし、実際の運用は 個人の生産性向上 止まり、企業全体の利益や売上には直結せず

生成AI導入が失敗する理由

  • 生成AIツールが 現実の業務プロセス と合致しない点が大きな課題
  • 脆弱なワークフロー文脈学習の不十分さ日常業務との乖離 が指摘
  • ほとんどの生成AIモデルは 過去のフィードバックを保持できず新たな推論能力も構築不可
  • 文脈適応力の低さタスク横断的な学習の困難さ が障害
  • これらの制約が 長期的なシステム統合のコスト増大効果の限定 を招く

企業の期待と現実のギャップ

  • 生成AIの盛り上がりにより、経営層では 過度な期待 が先行
  • 実際には 利益やコスト削減への効果は限定的
  • AI活用例
    • カスタマーサポート
    • マーケティング
    • ライティング支援
  • これらは 従業員の時間短縮 には役立つが、 直接的な収益増加 には繋がりにくい

雇用への影響と今後の見通し

  • 生成AIによる 大規模な雇用喪失 は短期的には起こりにくいとの指摘
  • 影響はむしろ 外部コスト削減 (アウトソーシングの抑制)にとどまる見込み
  • 組織再編や大規模な人員削減 は当面現実的でない
  • 世間の「AIが職を奪う」という 一般的なイメージとは逆の結論

生成AI導入の課題と今後の指針

  • 多くの失敗は AIの能力への誤解 が原因
  • AIは テキストやコード生成 は得意だが、「人間のような学習」は困難
    • 例:人間は新指示や過去の失敗から柔軟に修正できるが、AIモデルは タスクをまたいだ記憶保持不可
  • 投資家や経営者 は今後の技術進化に期待
  • しかし 短期的な進展は緩やか で、 全社的な変革には時期尚早
  • 導入時は 即効性のある狭い用途 (カスタマーサポート、コーディング支援、ドキュメント作成など)に絞るべき
  • 全社規模の統合や劇的な変革は失敗リスク大

生成AIの本質的な位置づけ

  • 研究者の指摘:「 AIはタスクには強いが、戦略には弱い
  • 意思決定プロセス全体をAIで代替するのは 非現実的
  • 成功事例は 一部企業の限定的な成果 にとどまる
  • 大半の企業では ルーティン作業の小規模な効率化 が限界
  • MITの調査 からの教訓
    • 生成AIは「 万能な成長エンジン」ではなく「 限定的なツール」と捉えるべき
    • 過度な期待や流行追従 は危険
    • 人間のような適応力 を獲得するまで、AI導入による利益拡大は大多数の企業にとって困難

Hackerたちの意見

「今、私たちは『幻滅の谷』に入っているところだ。このハイプサイクルは非常に予測可能なんだ。GPT-5が無限の期待の後に失望として評価されるのは、GenAIの『ジャンプ・ザ・シャーク』の瞬間として語り継がれるかもしれない。楽しいことばかりではなく、経理の人たちが投資のリターンの証拠を求め始めると、状況は変わる。GenAIの人たちは覚悟しておいた方がいいよ。これから波乱が待ってるから。賢い人たちはすでに次のハイプの波に乗る準備を静かに進めている一方で、他の人たちはこの列車が谷の底に向かうのを見守っている。これからますます必死なPRが出てきて、これが価値を生むことを示そうとするだろうね。」

「95%の企業がこれが金食い虫だと知っていても、株価を下げないためにお金を無駄にする義務があるって思っても驚かないよ。」

「次のハイプサイクルは、私たちのような賢い人たちが取り組むべきものは何だろう?」

ジェミニは相変わらずすごいね。彼らの反復的なアップデートでも改善が見られるけど、改善のスピードがかなり遅くなってきてる気がする(量と改善の度合いの両方で)。壁にぶつかるかもしれないね。ただ、こういう技術は自体もジェットコースターみたいなパターンを辿ることがあるから、たくさんの革新と改善があって、その後はあまり改善がないけど研究が進んで、また大きな改善が起きることもあると思う。LLMは、コンピュータビジョンが流行ってた時よりもそのパターンに従う可能性が高いと思う。

クラッシュに備えろ: 「AIデータセンターへの支出は非常に大きく、GDP成長の大きな部分を占めている」 - https://fortune.com/2025/08/06/data-center-artificial-intell...

いい指摘だね。ウィンドサーフィンの人たちが危機を感じて、早めにキャッシュアウトしたのかな?

もしGPT-5が去年リリースされてたら、もうちょっとハイプをコントロールできたかも。でも、待ちすぎて、欲張りすぎた結果、ローンチが失敗しちゃった。中には、GPT-4oに夢中になりすぎて新しいGPT-5を嫌ってる人たちの悪いPRも見かけるし。

おそらくOpenAIにとっては失望の谷に入った感じだね。AnthropicやGoogleはちゃんと成果を出してるのに。

サム・アルトマンはGPT-5の能力を過剰に宣伝しすぎたね。ユーザーから見ると、大きな進化を感じないし。ただ、トレーニング可能なダイナミックルーターのアイデアは、計算リソースをかなり少なくして推論を実行できるようになるから、これは大きな勝利だと思う。ただ、ユーザーにとっての勝利とは限らないけどね(電力網にとってはいいことだし、OpenAIのモデルがコスト競争力を持つようになるのは良いことだね)。

OpenAIがGPT-3.5-TurboからGPT-4に移行したときは、すごく大きな変化に感じたし、その間に他のステップはなかったよね。そして、他に意味のある競争モデルも出てなかった。GPT-5が出たときは、GPT-4からGPT-5に進化したわけじゃない。GPT-4以降には、4o、o1、o3、o3-mini、o4-mini、o4-mini-high、GPT-4.1、GPT-4.5などがあったし、競合他社からもLlamaやDeepSeek、Geminiなどのモデルがたくさん出てる。GPT-3.5からGPT-4へのジャンプはもう二度と体験できないだろうね。もしGPT-5が初の推論モデルだったら、そのくらいのジャンプに見えたかもしれないけど、何の初でもなかった。OpenAIが提供してきたすべてのモデルを一つのモデルファミリーに統一しようとしてるんだ。

ハハハ!私はある生成AI会社の成長チームをリードしていて、月曜日にチームに「顧客がリターンを得て価値を感じていることを証明するコンテンツを作り始める必要がある。なぜなら、私たちは幻滅の谷に入っているから」と言ったんだ…でも、必死に聞こえないように気をつけるよ ;)

「今週の重複した議論(162コメント):https://news.ycombinator.com/item?id=44941118 これがこのコンテンツファームのAIが書いた記事にはリンクされていない元のレポートだよ: https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Bus...」

「今日、実際に収益を生むか、少なくともコストを削減できるユースケースは何だろう?考えられるのは:1. オンラインでの影響力を作るためのコンテンツ生成。今は多分過剰供給になってて、もっと洗練されたモデルでも改善は難しいと思う。2. ジュニア開発者をClaude Codeやそれに似たもので置き換える。まあ、部分的には機能するけど、結局、どんなに経験豊富でも一度に一人しか面倒見れないから、現実的には生産性が50%上がるかどうかって感じ。3. カスタマーサービスのスタッフを置き換える。長期的には効果があるかもしれないけど、収益を生むのではなくコストを削減するから、影響には上限がある(電気代だけのコスト)。4. 支援ツール。基本的な分析を行ったり、文章をチェックして良くしたり、二次的なグラフィック資産を生成したりする。少しはお金を節約できるけど、大きな利益にはならない。結局、あなたが制約要因だから。ちなみに、私は文章の編集に使ってみたけど、最小限の実際の文章作成をさせると結構うまくいく。言葉を増やせば増やすほど、エッセイは悪化する。ぎこちない表現を指摘したり、テーマの欠けている部分を見つけるのは本当に役立つ。5. ゲーム内のキャラクターやロボット犬などのAI。こういうのは、厳密な因果関係のクエストベースのシステムがないゲームにとって、新しいフロンティアになるかもしれない。6. AIの彼氏や彼女、その他のNSFWコンテンツ。人間との本物のつながりが優先されるようになるまでの10年くらいは、良い収益源になるかも。見逃しているユースケースは何だろう?」

「簡単にプラグアンドプレイできるソリューションとして見たいユースケースの一つは、企業の膨大な内部文書やウィキ、コードベースを活用したRAGの構築だ。これで開発者がオンボーディングや情報検索をもっとスムーズにできるようになるといいな。人間を言語モデルで置き換えようとする人が減って、言語モデルを使って人間の仕事をもっとストレスフリーにしようとする人が増えてほしい。」

ストック画像ね。AI動画を使ったトレーニングコース(コンプライアンスのため)を見たことあるけど、ちょっと気持ち悪い感じ。でも、実際の人を撮影するより安上がりなんだろうね。

月200ドルで+50%の生産性向上は素晴らしい価値だね!ほとんどの国は年間0~2%の生産性成長しかないのに!

今、LLMを使って半構造化文書から特定の情報を引き出して、正しいアカウントに分類・ファイルするプロジェクトに取り組んでるんだ。精度は約95%で、まだ微調整も始めてない。今後しばらくは人間のチェックが必要だと思うけど、それでも各アイテムに人間が承認を入れることで、事務スタッフの時間を年間何百時間も節約できるよ。こういうプロセスの自動化や半自動化にはたくさんのチャンスがあるね。基本的には情報の抽出と分類作業なんだけど。

AIカスタマーサービスは、エンドユーザーとして使うのがすごくイライラするよ。

「なんとか動く」って言うのも、ポイント#2には優しすぎるよ。クロードコードのエージェントがコードをスパムのように出してるのは…何かだね。でも、それは人間を全然置き換えられない。たとえジュニアでもね。全く別のものだよ。

ジュニア開発者をクロードコードやそれに似たもので置き換える。なんでみんな「置き換え」って考えるのか分からない。コンパイラーが出たときに、コンピュータープログラマーが一斉に置き換えられたわけじゃないよね?もちろん、彼らはもっと生産的になって、もっと多くのことを成し遂げたから、価値が上がったんだよ。

MS Copilotは会議の議事録や要約にはかなり便利だよね。良い手書きのメモには及ばないけど、時間をめっちゃ節約できる。

このAIの盛り上がりの問題の一部は、あなたが冗談を言っているのかどうかわからないことだよね。ほとんどの提案はひどいし、4と5は納得できる。

AIの最も重要な使い道は翻訳だと思う。今や誰でも世界中の顧客やクライアントとコミュニケーションが取れるし、顧客向けの資料を世界中のどんな言語にも翻訳できる。つまり、潜在的な顧客が数百万から数十億に広がるってことだね。

「人々が犯している最大の間違いは、AIを製品として扱うのではなく、機能として扱っていることだ。人々が仕事をしているとき、『今日はAIと話すのが楽しみだな、チャットボットと話すのが待ちきれない!』なんて思わない。人々は退屈せずに仕事をしたいだけで、そこにAIが関わってくる。でも、もちろん、機能をハイプすることはできない。結局、私たちは製品を売るわけだから、今の状態はそういうことだ。NotionやSlack、Airtableに行くと、見出しは『テキストエディタ、企業チャットなど』ではなく、まずAIを強調している。問題は、AIが『モノ』ではなく、『モノに至るためのツール』だということ。」

「同意する。ここには本当に心の自転車を作る可能性があるのに、マーケティング部門は人々にスパンデックスのサイクリングショーツを売ろうと飛び込んでいる。」

もし「また一つのツール」として提示されるなら、別に気にしないけどね。たまにポップアップで「これがあるよ、クールな使い方があるから、自分のペースでチェックしてみてね」って言ってくれればいいのに。実際には、AIのキラキラやロゴ、自動補完がどこにでもあって、ちょっと気が散るよね。自分の仕事のバックアップダンサーじゃなくて、主役になっちゃってる。確かに役立つアプリケーションがあるかもしれないけど、それはユーザーが自分のニーズに合わせて決めることだよね。すべてのUIの前面に押し込むような強引なアプローチは、絶望感や必要性、権利意識を感じさせるよ。こういう会社はたまには静かにしてほしいね。

それを機能とは呼ばないかな。これは技術を支えるものだよ。一度も「この製品にAIが欲しい」とは言ったことがない。「この作業ができるようになりたい」と言うだけ。もし会社がその機能を製品に追加したら、買うよ。AIを使ったか、従来のアルゴリズムを使ったか、魔法を使ったかなんてどうでもいい。自分がやりたいことができるかどうかが大事なんだ。多くの会社がAIを製品に無理やり組み込もうとして、AI自体が欲しい機能だと思い込んで、実際のユーザーの問題を解決することを忘れてるんだよね。

この意見、めっちゃいいと思う!実際、スタートアップがランディングページで「MCP」って言ってるの見ると、ちょっと不安になるんだよね。プロトコルのことだし、「ここではHTTP使ってます」って言ってるようなもんだし。間違ってるかもしれないけど、結局「ai」製品には.comを買った方がいいよ、ドット-aiバブルを生き残るためにね。 [1] LLMは大好きだけどね!すごい数学と技術だよ。 [1] - https://en.wikipedia.org/wiki/Dot-com_bubble

1000%同意!今のAIの「アプリケーション」って、問題を探してる解決策ばっかりだよね。

本当にそう!製品自体が価値のあるものであるべきなのに…基盤となる技術に関係なくね。

それは本当だけど、そうなると高評価やクレイジーな盛り上がりがなくなるよね。この「目が覚める瞬間」は、ソフトウェアエンジニアリングの数少ないホットな分野の一つをしぼませるかもしれない。みんな、盛り上がりの列車を止めるのをためらうかもしれないけど、そうなると「業界全体がちょっとヤバい」ってことを本当に受け入れなきゃいけなくなるし、今は5年前や10年前よりもソフトウェアエンジニアにとってあまり良い時期じゃないからね。

正直に言うと、今AIエンジニアリングチームのリーダーやってるから、AIが価値を生み出すって思われるのが一番大事なんだ。うちの会社が毎年何百万ドルも節約できる、比較的簡単なAIの使い方があるんだ。大規模なコールセンターを運営していて、エージェントは以前は通話後に3~5分かけて手動で要約を書いてたんだけど、最近AIを使ってその要約を自動で作成するようにしたんだ。要約の質は人間のエージェントが作ったものよりも良くて、エージェントたちはより価値の高い仕事に集中できるようになった。かっこよくはないし、誰かの仕事を奪うわけでもないけど、すごく明確な効率向上があるんだ。

人間のエージェントたちもAIの要約が自分たちのより良いと思ってるのかな。読んでて頷いてたけど、「でも、自分の会議の要約はできないだろうな」って思ったから、これが第三者の視点でしか通用しないのか気になる。

仕事でAIを使った会議の要約を試してみたけど、要約を直すのに時間がかかりすぎて、結局自分たちで書くようになっちゃった。何か特別なトレーニングをしたり、使い方に工夫があったりするの?

なるほどね。AIは色々なことに役立つのは明らかだけど、データセンターの電話を要約するために何十億も投資する人はいないよね。データセンターの労働者を置き換えることが金になるわけじゃなくて、年収10万~20万の労働者を置き換えることが重要なんだ。

プロのヒント:証拠として必要になるまで要約は全く書かない方がいいよ。通話の音声を24Kb/s Opusで保存しておけば、1分あたり180KBになるから。1年後とかに、古い音声は削除すればOK。これで何百万も節約できるよ。

エージェントは以前、各通話の後に手動で要約を書くのに3~5分かかっていた なんでそんなことしてたの?この特定のケースではそうじゃないかもしれないけど、見たAIビジネスケースの多くは無駄なことの自動化がうまくいってるだけだと思う。誰も読まないレポートを自動化してるなら、出力の質は問題にならないし、AIが間違っても関係ない。業務最適化には「無駄を自動化するな、切り捨てろ」という言葉があるけど、AIが労働の無駄を隠すために使われている気がする。それが結局、最適化ができないってことが分かればいいんだけどね。

誰が要約を読むの?そもそも役に立ってるの?それとも、ただみんなの3~5分の無意味な作業を節約しただけ?

精度が重要じゃない限り、そうだと思う。要約内の幻覚が問題で、それが原因でシステムに組み込むのが難しいんだ。

Google Meet使ってるんだけど、会議の内容がGeminiで文字起こしされるんだ。でも、めちゃくちゃ間違ってるよ。誰が何を言ったか混乱しちゃうし、「ジョーがアプローチXで行くべきだって言った」ってところが、実際は「ジョーはXをやるべきじゃない」って言ってるのに逆になってることもある。文脈がないから、社内用語も「俺のiPhoneが言ったクソ」レベルで聞き間違えちゃうんだよね。

気になるんだけど、これでエージェントの士気に影響が出てるって感じる?具体的には、今は実際に電話を取る時間が増えたのかな?利用率が燃え尽きるポイントに達してなければ大丈夫だと思うけど、私がコールセンターをサポートしてた時、利用率を上げようとするプロジェクトがいくつもあったけど、コールセンターの燃え尽き症候群がどれだけリアルか分かってないんだよね。もちろん、これはあなたにとって新しいことじゃないと思うけど。ある利用率の閾値を超えると、エージェントが燃え尽きて、意識的か無意識かに関わらず良いコールを取ろうとし始めるから、AHTが上がってくるのがいつも見えてた。カスタマーサービスのコールセンターか営業かでも、ちょっと違うかもね。私は実際に電話でエージェントとして働くのが嫌だったけど、コールセンターの運営や戦略はいつも魅力的だったな。

それは大事なポイントだね。実際の使用例ってあんまり魅力的じゃないし、過剰な宣伝や「クリエイティブマーケティング」に向いてないんだよね。

レポートのPDFへのリンクがランディングページにリダイレクトされて、「この『研究』は普通のコンテンツマーケティングだな」と思っちゃった。ページの下にあるCTAには「革命に参加しよう / エージェントウェブの最前線に立とう。あなたのAI製品やツールの露出と早期採用を得よう」って書いてあって、客観的なレポートとは思えないよね。どちらにしても、連絡先情報のフォームの後ろに隠れてるから、研究の質について直接は言えないのがまた悪い兆候だね。記事から引用すると、> 「研究者たちは、ほとんどの使用例が企業全体の利益を改善するのではなく、個々の生産性を高めることに限られていることを発見した。」ってあるけど、これってどういう意味なんだろう?

作者の名前をクリックしてみて。動かないよ。これは本当の作者でも本当のサイトでもない。HNはredditみたいになってきて、みんなタイトルを見て、コメントを見に来て、タイトルに同意するかどうかで投稿してる感じ。

ここにレポートがあるよ: https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Bus... そこに書いてあることは、記事とは全然違うんだ。一部の情報としては: - 予算の50%(失敗する方)がマーケティングと営業に使われた - 著者たちは、AIが労働価値で2.3兆ドルに相当する自動化を提供する可能性があると見ている - 失敗の主な障壁は、新しいツールを導入する意欲の欠如、経営層のサポート不足 ここにいる多くの人が結論を急いでるけど、AIは機能しないってわけじゃないと思うよ。レポートはそう言ってるわけじゃないと思う。

ここには結論を急ぐ人がたくさんいるね。AIは機能しない。レポートがそう言ってるとは思わないけど。まあ…「給料が理解しないことに依存していると、人を理解させるのは難しい」

3900万の職に影響が出る Wow、それはすごいね。アメリカには1億6300万人が働いてるから、労働力の4分の1近くが危険にさらされてるってことだ。

人々が実際にレポートを読んだらどれだけ残念だろうか。https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Bus... > 「公式のLLMサブスクリプションを購入したと答えた企業は40%に過ぎないが、私たちが調査した企業の90%以上の従業員は、仕事のタスクに個人のAIツールを定期的に使用していると報告している。実際、ほぼ全員が何らかの形で仕事にLLMを使っている。多くの場合、シャドーAIユーザーは、公式のAIイニシアティブがパイロット段階で停滞している間、個人のツールを通じて毎日何度もLLMを使用している。企業のイニシアティブは失敗しているが、人々は仕事でLLMを狂ったように使っている。この話は、思われているほどの衝撃的なものではなく、実際には逆の方向に進む可能性もある。」

MITのレポートを参照した似たような見出しや記事を見るのはもううんざりだ。すごく怠惰なジャーナリズムで、ほぼクリックベイトだよ。MITのレポートはプロAIグループのプロジェクトNANDAによって作成された。彼らについてはここで読んでみて: https://nanda.media.mit.edu/ 元のフォーチュンの記事はこちら: https://fortune.com/2025/08/18/mit-report-95-percent-generat... 具体的に生成AIのパイロットプログラムについて言及している。「しかし、データセット内の95%の企業にとって、生成AIの実装は期待外れだ。核心的な問題は?AIモデルの質ではなく、ツールと組織の「学習ギャップ」だ。経営者はしばしば規制やモデルのパフォーマンスを非難するが、MITの研究は企業統合の欠陥を指摘している。」お金が山ほどあっても、95%の企業はそのお金を拾う方法がわからないから、ゼロリターンに終わるだろうね。

この統計で一番面白いと思ったのは、メディアの報じ方だね。一見似てるけど、よく見るとライターたちがちょっといい加減に扱ってるのがわかる。

「カスタムエンタープライズAIツールのうち、実際に運用に至るのはたったの5%」 「エンタープライズAIのパイロットプロジェクトの95%が収益を増やせない」 「なぜ95%のジェネレーティブAIパイロットプロジェクトが失敗しているのか?」 「95%の企業が『ゼロリターン』を見ている」 「統合されたAIパイロットの5%が数百万の価値を生み出している」 「エンタープライズにおける95%のジェネレーティブAIの実装は、P&Lに測定可能な影響を与えていない」