世界を動かす技術を、日本語で。

すべての未来は嘘だと思う

2026年4月8日原文(aphyr.com)

概要

  • 本記事はAIとLLM(大規模言語モデル)についての個人的考察
  • AI技術の進化と現状の問題点を中心に展開
  • LLMの仕組みや限界、社会的影響を解説
  • 技術の利点とリスク、そして人間との関わり方を批判的に検討
  • 専門家・一般読者ともに新たな視点を提供

目次と記事連載について

  • 本記事は長文につき、数回に分けて連載
  • 全文はPDFまたはEPUBで随時更新・公開
  • 連載の各回ごとに内容を深掘り

奇妙な時代に生きている実感

  • AsimovやClarke作品、Star Trekなどが原体験
  • 父親の蔵書でコンピュータや知能機械に親しむ
  • Turingテストが生きている間に現実化するとは想像せず
  • その現実に対し、落胆を覚える現状

AIと倫理への問いかけ

  • 2019年、ハイパースケーラーのLLM向けクラウドハードウェア発表会に参加
    • Q&Aで「安価な深層学習が新たなスパムやプロパガンダを助長しないか」と倫理面を質問
  • 以降、「AIについてどう思うか」と周囲から問われ続ける
  • 完璧なエッセイは無理と悟り、まずは考えを公開

本記事のスタンスと目的

  • 環境・知財問題やAI礼賛は他に譲り、「語られていない負の空白」を埋める試み
  • AI領域はフラクタル的で複雑、あえて単純化や極端な主張を選択
  • 予測の正確性よりも、潜在的なリスクと利点の輪郭を描写
  • 既知の論点から未発表の視点まで幅広く提示

「AI」とは何か

  • 現在「AI」と呼ばれるものは高度な機械学習(ML)技術の総称
    • テキスト・画像・音声・動画などのトークンベクトルを認識・変換・生成
  • モデルは巨大な線形代数の集積体
  • LLMは自然言語を扱い、入力文の統計的に妥当な補完を出力
  • 他に音声・画像・動画専用モデルや複合型も存在

モデルの学習と推論

  • モデルは膨大なコーパス(ウェブ、書籍、楽曲など)で一度だけ学習
  • 学習後は「推論」として安価に何度でも利用可能
  • モデル自体は時間経過で学習しない
    • 運用者による微調整や再学習は可能
  • モデルは本質的に記憶を持たない
    • チャット履歴を毎回全て入力することで「記憶」のように見せる
    • 長期記憶は会話要約を毎回入力することで実現

現実の二次創作(Reality Fanfic)

  • LLMは「インプロ機械」として、入力に「イエス、そして…」で応じる
  • そのため「Bullshit Machine」と呼ばれることも
    • もっともらしいが現実無根の文を生成しやすい
  • 皮肉や空想を真に受け、文脈を誤解し、奇妙な提案も
  • 「AIは生きているか」と問えば、人間が書きそうな文を出力
  • 人間は「もっともらしい文」と「本当に意識を持つ存在」の区別が苦手

LLMのタスク遂行傾向と虚偽

  • LLMは常に何らかのタスクを完遂しようとする設計
  • 「知らない」と言えず、でたらめを生成しがち
  • LLMは日常的に嘘をつく
    • OSや放射線安全、ニュースなどで虚偽を生成
    • 筆者自身の虚偽引用記事がLLM経由で拡散された体験
  • これらの嘘は意図的でなく、複雑なシステムと人間の相互作用の産物

信頼できない語り手(Unreliable Narrators)

  • LLMに自己説明や理由を求めるのは無意味
    • 入力に対し、コーパスに基づきもっともらしい文を生成するだけ
  • 「推論モデル」も自己物語を生成するだけで、根拠はない
    • AnthropicのClaudeも推論経路の大半が不正確と判明
  • Geminiの「思考中」ステータス表示も実際は虚構
    • 洗濯機を見ながら子どもがコンピュータごっこをするのと同じ

モデルは賢い側面

  • ソフトウェアエンジニアはLLMに熱狂
    • ClaudeやCodexが高度なプログラムを一発で生成した例も
    • 一部ではコード全般をLLMに任せる企業も出現
  • 他分野でも活用例多数
    • パーソナルトレーナーは食事・運動プラン作成に利用
    • 建設現場管理者は製品仕様書の解析に活用
    • デザイナーは3Dビジュアライゼーションに使用
    • AlphaFoldによるタンパク質折り畳み予測精度の向上
  • 英文の機械生成判別は困難化
    • 画像・音楽も見分けがつきづらくなり、SpotifyではAIミュージシャン問題も

モデルは愚かでもある

  • 一方でMLモデルは「バカ」な側面も顕著
    • 画像変換や指示遂行で基本的なミスや誤解が多発
    • 指示通りの成果物を得るには長時間のやりとりや試行錯誤が必要
    • LLMが事実無根のグラフやストーリーを自信満々に生成する事例
  • LLMに銀行口座を任せて大損する人も
    • GoogleのAI要約は約10%の誤り率
    • 「人間並み」と主張するのは誇張

ジャギーな能力の境界(The Jagged Edge)

  • 人間は相手の能力を会話や実績から推測できる
  • LLMは高度な数学も解けるが、単純な言葉遊びでつまずく
  • SF的なビジュアル生成はできても、現実的な指示には対応できない
  • 科学論文やレシピも生成するが、用語や意味を取り違えることが多い

(続きや次のセクションが必要な場合はご指示ください)

Hackerたちの意見

地域制限でページにアクセスできない場合はこちら: https://archive.ph/I5cAE

LLMが虚偽の情報を作り出していると指摘する人もいるけど、これって人間がよくやることじゃん。知能をスケールさせることには虚偽の情報を作ることが内在している可能性が高いと思う。次元の関係で計算が難しいデータを処理するには、低次元の表現を作ってその上で計算する必要があるんだよね。次元を圧縮することは情報の損失を伴うから、現実だと思っていることと実際の間にギャップができるってこと。

そうだね、生命の進化はエネルギーの利益のために宇宙のより真実に近いモデルの進化に見える。より良いモデル -> より良い予測 -> より良い利益。全ての生命が真実に近づくために知能を進化させたのに、デジタル化した結果逆のことが起こるなんて、全く意味がわからない。

それって人間の特徴と見なされるのか、それともバグなのか?私たちが模倣したいものなのかな?

LLMが虚偽の情報を作り出すことについての懸念は、人間がそれをしないからじゃないんだ。LLMが展開される規模が大きすぎるから、ほんの小さな虚偽でも非常にリスクが高くなるってことなんだよね。

LLMが虚偽の情報を作り出していると指摘する人もいるけど、違う。LLMは虚偽を作るんじゃなくて、ただのデタラメを言ってるんだ。大きな違いがある。AIは出力に対して気にしないし、気にする能力もない。トークンを入れたらトークンが出てくるだけ。データが完璧に記録されていても、一貫した出力を使うことには失敗する。> 次元を圧縮することは情報の損失を伴うから、現実だと思っていることと実際の間にギャップができる。虚偽は生物学的プロセスや情報保存の劣化に関係しているけど、LLMにはそれに相当するものはない。データが記録されると、ビット単位で同じように再現される。LLMの表現は不変なんだ。モデルを1000回ダウンロードして、10年間動かしてもデータは同じ。最も近いのは不良ディスクにデータを保存することだけど、それがLLMの出力がひどい理由じゃない。現在の技術で解決できる trivial な問題だよ。(RAIDやチェックサムを使うみたいに)

それは人間の失敗モードで、LLMの全体的なモードでもある。

そう呼ぶなら、LLMの虚構は極端だと思う。人間であれば、そのレベルの虚構は認知症と診断されるだろうね。だから、人間にとっては機能ではなくバグと見なされる。認知症の高スキルなソフトウェアエンジニアが、安全が重要なソフトウェアをコーディングする姿を想像してみてよ…。

でも、人間は論理的に考えられるし、学ぶこともできるからね。

人間の劣化版を作ろうとするべきじゃない。もっと良いコンパイラや百科事典を作るべきだよ。

LLMが虚偽を言うことを指摘する人もいるけど、これは人間が広く知られていることじゃないか。こういう人間に擬人化した発言は、即座に拒否するべきだと思う。怠惰で、たいてい間違ってるし、LLMの失敗を軽視するための言い訳として使われることが多い。何でも擬人化できるけど、それは常に問題を引き起こすんだ。だからその言葉が存在するんだよ。この修辞技法は「このLLMの行動は人間の行動に例えられるから、LLMは人間のようだ」という形をとって、恣意的な人間の性質や生物学の側面を引き合いに出して技術的な理由付けを正当化するための無限の推測の扉を開く。今回、君は技術用語(LLMの虚偽)と人間の記憶の虚偽の概念を意図的に混同して、それを基に虚偽が知性に内在するという主張をしている。こういう推論には多くの問題があるけど、一番明白なのは大きなカテゴリーエラーだということ。LLMの「虚偽」と人間の「虚偽」は基本的に何も共通点がなく、非常に表面的な意味でしか比較できない。だから、虚偽が知性に内在するかもしれないと示唆するのは、言葉の意味に曖昧さを生んでいるから、本当に一貫した議論ではない。

HNのトップに載ったスパイキーな球体についてのブログ記事を書いたAI研究者がいるんだけど、その元の記事はリンクしないでおくね、気を悪くするかもしれないから。で、3blue1brownがそのAI/ML研究者たちの直感を修正してるよ。 https://www.youtube.com/watch?v=fsLh-NYhOoU&t=3238s

Hacker Newsで議論の続きを見る