世界を動かす技術を、日本語で。

AIが世界を飲み込む(2026年春)[pdf]

概要

このリクエストは文字化けしており、内容を正確に読み取ることができません。 再度、正しい日本語または英語のテキストでご入力ください。 内容が判読でき次第、迅速に記事作成や翻訳を行います。

文字化けしたリクエストへの対応

  • 文字化け が発生している場合、 内容の解読 が不可能
  • 再送信 をお願いする案内
  • 正しいテキスト での入力推奨
  • 判読可能なデータ があれば対応可能
  • ご協力依頼 のメッセージ

もし意図した内容があれば、再度ご入力をお願いいたします。

Hackerたちの意見

最後にすべてが変わったのはいつだった?

  • ハードウェア時代(1995年以前) -> IBM、Intel、Microsoft、Apple
  • インターネット時代(1994-2001年) -> Amazon、Google、Meta、Salesforce
  • モバイル時代(iPhone+時代) -> Uber、モバイルゲーム、YouTube、Snapchat、TikTok、Airbnb
  • クラウド時代(AWS+時代) -> AWS、GCP、Azure、Snowflake、Databricks、その他のデータ&データベーススタートアップ
  • AI時代(ChatGPT+時代) -> 変化は避けられない

いい分析だね!ハードウェア時代はメインフレーム時代とPC時代に分けるべきだと思う。インターネット時代はもう少し延ばして、2007年のiPhoneの発売あたりまでかな。編集: 元のプレゼンテーションはまだ見てなかった。エバンスがすでに私が提案したように時代を分けてるのを見た。

?それはその時代の恣意的な時代と企業のように見えるね。アマゾンとグーグルは2001年以降消えたと思ってるの?データブリックスは今やIBMより大きいと思う?変化は避けられないかもしれないけど、君のリストがそれを示しているか証明しているかはわからないな。

ベネディクトのデッキの4つのバージョンはここで見つけられるよ: https://www.ben-evans.com/presentations この考え方の時間的な視点はありがたいね。私の解釈: 2024年11月: これを軽視しないで。次のプラットフォームシフトかもしれない。けど、実際の質問はまだ決まってない: スケーリング、有用性、展開、ビジネスモデル。 2025年5月: モデル層はすでにコモディティ化の兆しを見せてるから、重要な質問は展開にシフトする: 製品、ユースケース、UX、エラー、企業の採用。 2025年11月: 資本サイクルが物語になってきた: みんなプラットフォームシフトを逃すのがオーバービルドより悪いからお金を使ってるけど、製品の形、モート、価値の捕捉についてはまだ明確じゃない。それがバブルのようなダイナミクスを生んでる。 2026年5月: 仮説としては、モデルはインフラになる可能性が高いけど、価値はアプリ、ワークフロー、製品、独自のデータ/コンテキスト、GTM、安価な自動化によって可能になる新しい質問に移動するかも。でも彼はこれをまだ仮のものとして明言してる。

DeepSeekはそれにとって重要かもしれないと思う。彼らはオープンソースの本当に良いモデルを持っていて、他のプレイヤーのハードルを上げてる: どれだけ良いモデルが必要かっていうと、DeepSeekよりも良くないと意味のあるお金は稼げないってこと。オープンソースの提供が人気になった他の場所でも同じことが起こった。

まあ、そうだね。これがどうなるか分かってるって言う人はバカだよ。

エヴァンズの仕事は評価してるし、これに対する「反論」を2024年11月版で書いたんだ。「モデルがインフラになる可能性が高い」という方向転換を考えると、自分の見解をアップデートした方がいいかも。

こんなにたくさんのデッキがあるとは知らなかった。ありがとう!時系列で更新されたスナップショットとして考えるのは助かるね。これらのグラフで目立つのは、まだまだ早いってこと。法律業界みたいな、間違いなく大きな変革が起こると思う業界を見て、テクノロジーと比べて使用率がすごく低いのを見ると、これからもっと大きな変化が待ってるなって感じるよ。

まとめありがとう。ベネディクトの仕事が大好きで、彼はAIの変革の可能性を真剣に受け止めつつ、過剰な期待には流されない数少ないコメンテーターの一人だと思う。目立つ点としては、* 彼は歴史的なアナロジーが得意で、初期のインターネットやモバイルのような過去の変革を見ているのが特に良い。歴史学の学位を持ってるから驚きじゃないけど。 * 彼は、すべてが落ち着いたときにどうなるか、まだ全然わからないってことを何度も強調してる。それって歴史家らしい視点だと思う。例えば、ウェブの初期に人々が言ってたことを見ると、ほとんどの予測が間違ってた…未来がどうなったかを考えると、彼らは間違った質問をしてたんだよね。つまり、AIについても多分間違った質問をしてるんじゃないかな。 * それでも、モデルのコモディティ化についての彼の主張は、実際にはかなり強い具体的な予測だと思う。完全に同意するかはわからないけど、リーディングAIラボの評価を見るたびに頭に留めておくよ。 * 彼は、チャットボットはほとんど製品じゃなくて、AIラボは今のところそのレイヤー以上の製品を提供するのにあまり成功してないってことを繰り返し言ってる…もちろん、コーディングエージェントは例外だけど。

今、コーディングがLLMエージェントの使用において大きな部分を占めてるなら、最高のモデルがどれだけ輝き続けて、収益の大部分を占めるのか理解できない。テックハブからは遠いけど、より良いハーネスが、より制約された効率的で信頼性のあるコーディングエージェントに小さなモデルを活用すると思う。ある意味、これは蒸留するようなものだけど(実際にはそうじゃない)、より良いハーネスを作ることができる(より多くのエッジケースに対応、より良いツール/機能定義、サンドボックス処理、bash管理、DB管理、デプロイ管理など)けど、LLMが知っていることをコードに抽出すること。もしかしたら間違ってるかもしれないけど、最後のマイル(小さなビジネス)向けのカスタムソフトウェアが現実になるのを見たい。AIがソフトウェアの世界を飲み込むけど、コストは下がると思う。LLMから上流で価値を抽出して、よりタイトなコーディングエージェントを通じて下流に広げることができるから。私は小さくないコーディングエージェントを作ってる - たくさんのコードがあって、役割を慎重に混ぜた(ソフトウェア開発ショップを模倣)もので、異なる役割に別のツールが使えるようにしてる。このすべてのコードは他のコーディングエージェントによって生成されてる。 https://github.com/brainless/nocodo 私はどこにでもいる普通の人で、18年のソフトウェアエンジニアリングの経験がある。収益には興味ない。ただ、普通のビジネスオーナーのワークフローが自分のVPSで動くのを見たい。

素晴らしい仕事だね!

企業は「年換算」収益を報告するけど、これは過去4週間の合計に13を掛けたものだ。なんで13を掛けるの?

13*4=52週間、ほとんどの場合。

52週間 ÷ 4週間 = 13

28 × 13 = 364

そう、変だよね?「平均的な」月は4.35週間あるんだよ。(365÷7)÷12 = 4.3452…

ちょっと数学的な方向に行っちゃったのは、私の表現が悪かったからだね。実際に興味があったのは、4週間の収益がどうやって13倍して「年換算」になるのかってこと。

ビジネスでは1年に52週(413)があって、その結果、1年の通常の労働時間は2080時間(4052)になるんだ。これは単純さのために一般的に合意された時間の定義だと思う。多くのシステムでは、‘時給’は単に給料を2080で割ったものだから、他の指標で給料を割ろうとすると、数字がちょっとおかしくなっちゃうことが多いよ。

インターネット革命の時は赤ちゃんだったな。モバイル革命がすべてを飲み込んでたのは高校や大学の頃だった。大人になってからこの状況を見るのは面白いね。どこまで進むのかな。

ドゥーマーたちが思ってるよりは進むと思うけど、元のブームの投資家たちを満足させるほどではないかな。90年代に初めてウェブサイトを作った早期のインターネット信者として言うけど、モバイルデータ(EDGEデータでネットやIRC、IMを楽しんでた)、スマートフォン(N80ie)、ストリーミングメディア(RIP Windows MCE)など、いろいろ経験してきた。モデルはいつだって商品化される運命だったし、今の人気で実行可能なユースケースも「巨大なデータセットを分析して見逃しているパターンを見つけて調整する」とか「Xの機能/タスクのために決定論的なソフトウェアを確率的に生成する」みたいな感じで、仕事の置き換えよりもそっちの方が多い。モデルが互換性のある商品になっちゃうと、一発勝負は利益が出ないから、「成果で支払う」っていう試みがあったけど、結局は従来の消費ベースの請求方式に戻っちゃったね。

これは状況をよく考察した意見だね。技術的な面で、私が考えているもう一つのことは、これらのメガモデルが実は多くの非効率を隠している可能性があるってこと。単に高次元やパラメータを現在のモデルに追加するアプローチは結果を出してるけど、私には「メインフレーム」時代のコンピューティングのように感じる。大量の注釈付き人間コンテンツを投げ込んで、機械にそこからグローバルに関連付けを引き出させるのは不器用に思える。人々がルールシステムを通じて構造化された知識を学べるように、現在の技術基盤(トランスフォーマーやアテンションなど)をルールシステムから生成された例と上手く連携させることで、もっとコンパクトな表現モデルが得られる可能性があると思う。それが「高レベル」モデルを補強するベースレイヤーとして使われるんじゃないかな。巨大なデータセンターのリスクは、PC革命の直前にコンピュータセンターを構築するリスクに似てるかもしれない。もしこの知性のためにもっとコンパクトで効率的な表現が存在することがわかったら(これは技術の第一世代にいる今、あり得ると思う)、データセンターは分散知性の未来には無関係な古い技術の朽ち果てた霊廟になっちゃうかも。それが私にとっての大きな技術的な未知数だね。どれだけ効率を絞り取れるか、そしてそれが分散型の風景と集中型データセンターの風景にとって何を意味するのか。

そうそう、面白いのは、「ルールとヒューリスティックス」型のAIの基礎が70年代と80年代に築かれたってこと。現実のデータからパターンを抽出するための計算能力がまだなかった頃だよね。初期の試みは、ルールを手動で設定しなきゃいけなかったり、情報の密度が低い形式だったりして、うまくいかなかったんだ。だから、次のステージは人間がやってることをモデルが基本的にやるってことだね。因果モデルを構成可能なシンボリックな形でエンコードして、介入実験を通じて検証・洗練できるようにすること。

マーク・ザッカーバーグの引用がたくさんあるけど、メタバースに投資した80億ドルについての彼の言葉はあまりないね。

前のプレゼンテーションでそのチャートを使ったことがあるよ。

YCのAIスタートアップの比率には驚いた…(スライド48)。これは明らかなトレンドだね。

スライド22では、LLMラボ(OpenAI/Anthropic)を2010年代のモバイルデータ通信会社(AT&T、Verizon、TMobile)と比較してる。違いは、モバイル通信会社は標準(3G、4G LTE、5G)に従っていて、ほとんど差別化がないこと。どの会社を選んでも、どの国に行ってもほぼ同じだよね。実際には、AWS/Azure/Google Cloud/NeoCloudsをAT&TやVerizonと比較する方がいいと思う。データセンターは標準(CUDA/PyTorchなど)に従っていて、OpenAIやAnthropicはiOSやAndroidのようになってきてる。クラウドも通信も、インフラを構築するためにかなりの資本支出をしなきゃいけなかった。だから、この比較が良くないと思うから、次のスライドでは間違った結論を導いてる。例えば、モデルが5Gデータのようなコモディティになると思ってるけど、私は違うと思う。フロンティアモデルは典型的なデュオポリー/モノポリーのシナリオだよ。モデルが賢くなるほど、使われるようになって、収益が増えて、会社がもっと計算リソースを買えるようになって、次のモデルがもっと賢くなるって感じ。これはTSMCの先進的なチップノードにも似ていて、現在のノードが次のノードのために十分なお金を稼がなきゃいけない。TSMCは最も先進的なノード市場の95%以上を占めてる。80年代や90年代には、数十のチップファブ会社があったけど、今は3社しかない。1社だけでいいはずだけど、国家安全保障のおかげでインテルとサムスンのファブが救われた。中国のモデルはさらに遅れを取っていて、追いついていない証拠がある。多くの赤字のオープンソースラボが合併して収益生成に焦点を当てる必要があるから、統合が近く起こると思うよ。

自分でも半分の比較をしたけど、今の時代にSOTAモデルを作るのに必要な資本は、明らかに独占に繋がるほどのものじゃないよね。通信ネットワークが標準化されてるのは知ってるけど(昔、通信アナリストだったから)、それが商品化の前提条件ってわけじゃないし。

AIのスラップの中にあるヨギ・ベラの「AI予測」の重複スライドって何なの?