世界を動かす技術を、日本語で。

LLMは世界モデルではない

概要

  • LLM(大規模言語モデル)は「ワールドモデル」ではない という主張
  • チェスや画像編集などの具体例 でLLMの限界を説明
  • LLMは世界の本質的な構造を理解していない ことを指摘
  • 今後の機械学習のブレイクスルー予測
  • LLMの実用性と限界を区別 する重要性を強調

LLMはワールドモデルではない

  • LLMはワールドモデル(世界の構造理解モデル)ではない という主張
  • LLMが役立たない、または限界がある とは言っていない
  • 巨大なパラメータ数にも関わらず、「世界」を本質的に理解していない という問題提起

チェスの例:盤面理解の欠如

  • LLMは膨大なチェスの棋譜を学習しているが、盤面の状態を追跡できない
  • 定石外の弱い手を指すと、盤面を見失い不正な手を指す現象
  • チェスエンジンと異なり、「どこに駒があるか」を内部で保持しない
  • チェスの知識は「偶然」学んだもので、意図的な設計ではない
  • テキスト分布の予測のみが最適化目標であり、世界理解は副産物

画像編集の例:アルファブレンディングの誤解

  • Kritaなどの画像編集ソフトの「ノーマルブレンドモード」について誤った説明
  • 「色は数値で表現され、ブレンドは必ず計算で行う」ことを理解していない
  • 透明度や色の計算原理の本質的な理解不足
  • 正しい説明をプロンプトで引き出せても、意味を理解しているとは限らない

複雑な概念の誤解と「同意傾向」問題

  • アルファブレンディングの結合法則性(associativity)に関する質問で矛盾した回答
  • キャッシュ処理と結合法則性の関係を論理的に説明できない
  • プロンプトの誘導に流されやすい「同意傾向」や、逆に頑なな態度も見られる
  • 言葉の意味や背後の原理を理解せず、表層的なやり取りに終始

Pythonのスレッド安全性の例

  • Pythonリストのappend操作のスレッド安全性について誤解したまま議論を続ける
  • GIL(グローバルインタプリタロック)除去後の挙動について、設計意図と異なる主張を繰り返す
  • 証拠としてバグ報告を挙げるが、その意味を正しく解釈できていない

LLMの世界理解の度合いと限界

  • LLMが「世界をどれだけモデル化しているか」は定量化困難
  • 一部の知識(例:性別概念)は偶然埋め込まれるが、体系的な世界モデルには至らない
  • 特定の問いに答えられるのは暗記やパターンマッチであり、深い理解ではない
  • LLMは「偶然」世界モデルのようなものを学ぶことがあるが、再現性や汎用性は保証できない

結論と今後の展望

  • LLMは十分なエンジニアリングで実用的に活用可能
  • 本質的なワールドモデルの構築には新たなブレイクスルーが必要
  • 今後、ワールドモデルや少ない学習データで学習できる技術革新が予想される
  • LLMの限界を認識しつつ、実用と研究の両立が重要

このように、 LLMは言葉の分布を学習するだけで、背後の「世界」や「構造」を本質的に理解していない という指摘がなされている。 今後のAI発展には、より汎用的なワールドモデルの構築が不可欠 である。

Hackerたちの意見

このエッセイは、LLMの「解釈可能性」に関する文献にもう少し触れた方がいいかもね。特に、知識(例えば足し算)がニューラルネットワークの中でどう表現されているかについての実証結果とか。正直言って、LLMにたくさん質問して、間違ってるところを選り分けるだけじゃ、新しい洞察には至らない気がする。今の時点では、ちょっと古い感じもするし、LLMが数学オリンピックで金メダルを取るくらいだから、数学の世界モデルはかなり良いと思う。特定の方法で2 + 2 = 4を証明できないことを選り分けても、全然それを否定することにはならないと思う。LLMは完璧な世界モデルを持ってるわけじゃないけど、(人間もそうだしね)。彼らは一般的な知識を持つように訓練されているし、内部の表現が大幅に圧縮されているから、すべてをエンコードするための重みが足りてないんだ。だから、彼らができることには自然な限界があるわけじゃないと思う。

この文献から何か提案ある?

率直に言うのは実は優しさだね。「賢くて第一原理から考えている」と言ってくれてるなら、確かに新しいことを言ってるわけじゃないし、今の雰囲気に対して少し反対意見を言ってるだけだと思う。私の目的は、単に失敗を選り分けることじゃなくて、LLMからあまり良い出力が得られない理由を説明しようとしてるんだ。時にはすごく役立つこともあるしね。私の予測がどうなるか見てみよう。外れたらかなり間違ってるってことになるから。 「失敗が成功を否定する」ってのはできないけど、成功がどうやって達成されるかの理論を否定することはできるよ。そして、2+2=4よりもずっと良い例があるんだ。最近のこととして、ちょっと使える感じのものを挙げてるだけなんだけど。

LLMがブルーベリーの中にいくつのBがあるか数えられない時点で、彼らには全く世界モデルがないってことが明らかだよね。足し算(デジタル論理で数ゲートしか使わないもの)が数十億のノードを持つネットワークの中で特定のノードに過剰適合しているってのは、AI信者の中でも最も宗教的な人以外には驚きでもなんでもない。

https://arxiv.org/abs/2508.01191

しないこと:LLMを使ってチェスを対戦させること。すること:LLMを使って、リアルなチェスAIがあなたと対戦している間に雑談させること。これはチェス以外の多くのことにも当てはまるし、LLMの正しい使い方を示してるね。

LLMを見て思い出すのは、大学に行ってた時のチュートリアルだね。週に何回かあって、2人の学生と1人の教授がその週に勉強していることを話し合うんだ。教授が鋭い質問をして、学生がそれに答えようとする。時には、理解していないのに正しい答えを言ってしまうこともあった。どこかで読んだことをそのまま言ってるだけで、特定の言葉が入った文を教授が答えとして受け入れてくれる。でも、時々「うーん、実際には理解してないな」って変な気持ちになることもあった。これがチュートリアルの目的でもあるんだけどね。もう少し突っ込まれると、教授が本当に適切な言葉を出せない質問をしてくるから、バレちゃうんだ。数学のチュートリアルでは、ある方程式が答えを見つけるのに役立つことに気づくけど、その方程式が実際に何を表しているのか全然わからないことがある。経済学のチュートリアルでは、インフレーションや成長、特定の著者について言葉を並べるけど、直感を裏付けるものが何もない。これがLLMがやってることだと思う。実際にモデルを頭の中に持っている人にはとても役立つけど、データが手元にないときにはね。ある立場を支持する証拠を忘れてしまったり、記憶が不完全で議論の一部を見逃したりすることもあるから。そういう場合、LLMは本当に素晴らしい。関連する言葉をつなぎ合わせてくれるから、検討することができる。でも、専門家じゃないときには、全てがプラウザブルに聞こえる。挑戦すると、ただ謝って自分を訂正しようとするだけなんだ。

それに挑戦すると、ただ謝って自分を修正したふりをするんだよね。最初は正しかったのに!

この記事は面白いけど、ちょっと浅いね。0(?): 「世界モデル」の定義が提供されてない。チェスをすることなの?コンピュータが数学を使って色を混ぜる事実を覚えていることなの?そうだとしたら、ChatGPTは世界モデルを持ってるってことだよね?1. 著者は文脈ウィンドウとチェスの例で世界をモデル化できていないことを混同しているように見える。最新のモデルにチェスボードの画像や記譜を使って、その位置について質問してみることを挑戦してみてほしい。GMレベルの分析はできないかもしれないけど、何が起こっているのかのモデルは確実に持ってるよ。2. どのLLMを使ったのか説明せずに、これらの例を共有しないのは価値がない。モデルが大きくて良ければ良いほど、世界の内部表現も良くなる。自分で試してみて。世界や物理と関わる質問を考えて、GPT-5 Thinkingに聞いてみて。物事がどう動くかについてかなり良い理解を持ってるから!

「世界モデル」は、問題がどの世界にあるかを定義する文脈によって異なる。チェスの場合、どの手が合法か、合法な手を打つために駒の位置を知ることが世界モデルの一部だ。アルファブレンディングの場合、数学的操作であり、前景の透明度に応じて背景の可視性が世界モデルの一部となる。これらの例は、姉妹コメントに挙げられている主要な商業アメリカLLMからのものだ。文脈ウィンドウとチェスの駒を追跡することを混同しているように見える。文脈ウィンドウは10手を覚えるには十分大きい。モデルは駒を追跡するか、ボードがない状態で盲目チェスをすることになると述べるべきで、そうでなければ何をしているのか分からない。実際にそうなっていることが示されている。

色のブレンドや透明性、LLMが「色を知らない」って話はちょっと信じがたいな。毎日LLMを使ってOpenCVで画像処理やコンピュータビジョンのコードを書いてるけど、色空間や解像度、圧縮アーティファクト、フィルタリング、セグメンテーション、人間の知覚なんかをスムーズに考慮してるよ。PNG画像からアルファを取り除くのも、与えた大きなタスクの一部として自分で書いてきたから、透明性は理解してると思う。例えば「画像にざらつきがあるとXの方法で失敗する」って結果を説明すると、何が起こってるかを理解して、コードを適応させてくれるんだ。(実際の画像をアップロードしても動くけど、トークンをめっちゃ消費する!)しかも、あまり探求されていないニッチな分野での話だし。扱ってる画像は小さくて低解像度だけど、ほとんどの文献ではあまり考慮されてないみたい。標準的な技術をうまく使ってるけど、特定の要件に合わせて適応したり組み合わせたりしてるから、「新しい」ことも結構うまく扱えてるみたい。画像やビジョンについて推論して、ニッチな問題に対して動くコードを書けるなら、人間的に「色を知っている」かどうかは哲学的な問いだね。

自分で書いたのは、与えた大きなタスクの一部としてだから、透明性は理解している Or それは、特定の入力に対してトレーニングデータに広く存在する一般的なステップやパターンの組み合わせかもしれないね。トレーニングセットの中身を正確に知らないと思うけど、私も知らないよ。教えてくれないし ;) > でも、特定の要件に合わせてうまく適応したり組み合わせたりしてるから、「新しい」ことも結構うまく扱えてるみたい。自分たちの仕事や方法の新しさを過大評価しがちだけど、同時に機械がトレーニングするためのデータや情報の広さを過小評価しがちだよね。LLMは非常に洗練されたパターン認識器だ。あなたがやっていることがこれまでに正確に同じように行われたわけではないけど、パターンが適応されているし、アプローチも独自のものかもしれない。 > それは純粋に哲学的な問いだね 確かにそうだね。自分たちに問いかけるべき質問だ。

これと、前の投稿で「無能な管理が時には良い結果をもたらす理由」について書いてたのを見て、あなたはすぐにお気に入りのテックブロガーの一人になりそう。おそらく、あなたの結論が私の考えとほぼ一致してるから、すごく楽しめたんだと思う。(私はLLMに手を出したことのあるソフトウェア開発者で、どう動くかについてのざっくりした知識はあるけど、特別な知識はない。)それに、あなたの文体がすごく引き立ってる。誰もあなたの投稿がLLMによって生成されたなんて言わないよ。

ありがたいお言葉、感謝です!

この投稿で評価した点は、他のAI懐疑派の投稿とは違って、具体的で反証可能な予測をしているところだね。具体的には「LLMは大規模なコードベースを『自律的に』扱うことは決してできない」ってこと。将来的に振り返って、これが正しかったかどうかを確認できるね。私としては、LLMが2年以内にこれを実現できる可能性を80%と見てるよ、根本的なアーキテクチャの変更なしで。

「扱う」と「自律的に」はかなり重要な役割を果たしてるね。Cursorはすでにコードベース内のすべてのファイルをインデックス化して、質問をしてすぐに答えを得るのがかなりうまくできてる。目標をどこに設定するかの問題だね。

どれくらいの大きさ?「deal」ってここでは何を意味してるの?自律的に動くって、勝手に動くのか、それともユーザーの指示で動くのか?

「自律的に」って、バグじゃない微妙なアップデートが、クライアントのシステムの他の外部部分のワークフローを壊すかもしれない意味を変えるとき、どうなるの?そんなことはよくあるし、全ての意味やビジネスルールをきちんと書いて最新の状態に保つのは本当に難しいから、LLMはその意味を理解できないかもしれない。もしかしたら、コードやインフラを開発する代わりに、業界全体が意味や意図を明確にするために不可能に正確な仕様書を書く方向にシフトすれば、「自律的に」実現できるかもしれないね。

LLMは仮説を証明するのにかかる時間:無限年

言語モデルは、言語が世界モデルでないのと同じ理由で、世界モデルではない。記号は定義上、物事を表すだけで、物事そのものではない。地図は領土ではなく、説明は説明されるものではなく、「水」という言葉で濡れることはできない。彼らは意識のある存在にしか意味を持たず、その意味は非常に主観的で文脈依存だ。でも、機械的な記号操作を通じて真実を理解できると思っている人もいるみたい。もしかしたら、数百万の記号を追加すればいいと思ってるのかもね。不完全性定理を受け入れるなら、超知能AGIでも表現できない真実の命題がある。なぜなら、彼らができるのは一連のプレースホルダーを出力することだけだから。超知能を見たときにそれを知っているという明らかな誤謬は言うまでもない。テストスイートを書ける?

「記号は定義上、物事を表すだけだ。」 ヨネダの補題の教訓を見落としてるね。記号は他の記号との関係によって唯一無二に識別される。もしその関係がテキストで表現されているなら、原則としてLLMによって推測され、ナビゲートされることができる。ただし、テキストでうまく表現されない関係もある。たとえば、ボトルキャップを外すためにどれくらい力を入れるかみたいな暗黙の知識とか。私たちは、あなたの筋肉と脳の間の関係を言葉でうまく捉えられていないから、LLMはそれらを見逃したり、非常に大まかなバージョンしか持てない。でも…それが暗黙の知識の問題なんだよね。コミュニケーションが難しい知識なんだ。

「言語モデルは、言語が世界モデルでないのと同じ理由で、世界モデルではない。」 > 「記号は定義上、物事を表すだけだ。それは物事そのものではない。地図は領域ではなく、説明は説明されるものではない。「水」という言葉で濡れることはできない。」 かなり否定的なことが多いけど、要するに「物のモデルはその物ではない」ってことだよね。まあ、当たり前だけど。モデルなんだから。地図はモデルだし。

まず、(証明できない)真の命題は確実に表現できるよ。できなかったら、不完全性定理は成り立たないからね ;-) 不完全性定理を持ち出す人の中で、実際に何を言ってるのか全く分かってない人の割合が知りたいな。ほとんどの人は証明が何かすら知らないから、それがAGIへの道の障害にはならないよ… 次に、デジタルで表現できるどんな世界モデルも、正しく述べれば同じ議論の対象になるはずだ。LLMだけじゃなくてね。

数学には詳しくないけど、不完全性定理は形式的なシステムに適用されるんだよね?LLMを形式的なシステムだとは考えたことがなかったけど、そうなのかな?

「不完全性定理を受け入れるなら、様々な普遍性定理によって、十分に大きなAGIは人間の神経細胞の発火シーケンスを任意の精度で近似できる。」 だから、不完全性定理が神経ネットワークは真実を見つけられないことを意味するなら、それは人間の脳も真実を見つけられないことを意味する。結局、人間の神経発火パターンは物事を表すだけで、物そのものではない。何かを見る経験は、頭の中で物理的な宇宙を再現することじゃないんだ。

不完全性定理をそんな風に適用できるとは思わないな。LLMは形式的なシステムに縛られてないし。

シンボルは定義上、何かを表すだけだよ。実際のものとは同じじゃない。まず第一に、地図が領域になることについての話じゃなくて、LLMが私たちの脳の中の地図に似た地図を作れるかどうかがポイントなんだ。で、君の哲学的な意見に対して、もし宇宙に有限のものや場所しかないと仮定したら、なぜそれらを有限のシンボルのセットで表現できないの? 君が拒否しているのはチャーチ・チューリングの定理だよ(要するに、自然のメカニズムを含むすべての機械的プロセスは、シンボリックな計算でシミュレートできるってこと。ただし、弱いバリエーションや強いバリエーションがあるけど)。拒否するのは自由だけど、実際にそう考えている人は少ないよ(ペンローズの脳が普通のデジタルコンピュータでシミュレートできないという非正統的な考えでも、物理的な機械—脳—が私たちの興味のあることを表現できることを受け入れている)。 > 不完全性定理を受け入れるなら、そこに「もし」があるわけじゃない。それは定理だよ。でも、全く関係ない。つまり、ある論理システム、つまり機械的手段では証明も反証もできない数学的命題があるってこと。でも、もし何かが宇宙に存在するなら、それはすでに自然のメカニズムによって証明されているんだ。つまり、もし有限のシンボルのセットが自然の法則を表現できるなら、自然の中のどんなものでもその論理システムで証明できるってこと。これで最初のポイントに戻るけど、自然のメカニズムがシンボルで表現できない唯一の方法は、それが何らかの形で無限である場合、つまり有限の法則に従っていない場合だよ。言い換えれば、物理学が存在しないってこと。まあ、それが本当だとしたら、AIは私たちの心配の中で一番小さい問題だよ。もちろん、物理学が存在するなら、つまり宇宙が有限の法則に支配されているなら、それが未来を予測できることを意味するわけじゃない。なぜなら、それには物事を正確に測定し、自然の中での動作よりも早くシミュレートする必要があるからで、どちらも…難しいんだよね。

ゲーデルの不完全性定理はここではあまり関係ないと思う。人々がそれを適用しようとする場面は多いけど、特に重要なことを言ってない場合が多いから、一般的には公にそれを持ち出さない方がいいと思う。もし自分が示したいことをそこから導き出す方法を慎重に考えたか、少なくとも自信を持って厳密な議論にできるスケッチがあるなら別だけど。これがない場合、せいぜい「おそらくゲーデルの不完全性定理を使って[示したいこと]を示せるかもしれない」と言うのが限界だと思う。さて、真実をエンコードするテキストを出力するプログラムがあると仮定すると、そのプログラムに対応する推論システムを定義できるかもしれない。そうすれば、その推論システムはプログラムが出力する文を「証明」するものと見なされるだろう(おそらく論理的原則に基づいて他の文も含めて、推論システムが良い特性を満たすように)。これを定義した上で、(言語が算術に関する適切な種類の文を作成できるなら)この推論システムがゲーデルの定理によって矛盾しているか不完全であることを示すことができる。これは、その言語がそれらの文を表現できないということではなく、プログラムがそれらの文を出力しないか、プログラムから構築されたシステムが矛盾していることを意味する(推論システムがプログラムからどのように得られるかによって、推論システムが矛盾していることは、プログラムが時々誤ったり矛盾する文を出力することを示唆するだろう)。でも、これは君が言った「プレースホルダー」のこととはほとんど関係ないよ。ゲーデルの定理は、ある命題が特定の言語で表現できないと言っているわけじゃなくて、ある命題が特定の公理+推論システムで証明できないと言っているんだ。不完全性定理よりも、「真実の定義不可能性」の結果の方が、君が言おうとしていることに関連していると思う。それでも、たとえ君が示そうとしていることが真実だとしても、それが君の望む結果を示すとは思わない。たとえば、クオリアを言語で捉えることが不可能かもしれない、確かに納得できる。でも、論理は言語がどんな方法でも(集合的にさえ)参照できないものがあることを示すことはできない。なぜなら、何かを示すためには、それを参照しなければならないから。 ———— 「それのテストスイートを書ける?」うーん、「スイート」として何を数えるかによるかもしれないけど、テストプロトコルなら大丈夫だよ。私が考えているものは、テストに失敗した場合はちょっと高くつくかもしれない(賞金を提供するから)。

最後の引用がすごく共感できるなと思った。 > 「これらのアルゴリズムに大量のデータを与えることは、根本的に間違っているはずのアプローチが、エンジニアリングの努力によってかなり進む例の一つだ。データを欲しがる様子がその証拠だ。何かが十分に役立つなら、その努力を資金提供することができ、新しいアイデアに負けなければ、持続することができる。」

LLMを訓練するために使われる言語の性質が、その世界モデルにどう影響するのか気になるな。情報量と明確さを最大限に考慮した言語、例えばイースクイルみたいなのが、LLMの世界モデルをもっと正確にするのかな?