世界を動かす技術を、日本語で。

存在しないチャンピオンシップで優勝しました

2026年4月29日原文(ron.stoner.com)

概要

  • LLMの信頼性サプライチェーン攻撃 の脆弱性を実証した実験の全貌
  • Wikipediaと自作サイトを使った 循環的な引用 による「偽の世界チャンピオン」情報の拡散
  • LLMの検索層・学習コーパス・エージェント層 それぞれのリスクの解説
  • 個人・プロバイダー・Wikipedia に向けた具体的な対策案
  • 情報の信頼性検証と AI時代の情報汚染リスク への警鐘

LLMサプライチェーンを毒する方法 ― 6 Nimmt!世界チャンピオンの作り方

  • 6 Nimmt!の「世界チャンピオン」として自らをWikipediaで紹介し、 LLMがその虚偽情報を引用 する過程の実験記録
  • 実際には6 Nimmt!世界大会は存在せず、 架空の経歴と引用を20分で捏造
    • 自作サイト(6nimmt.com)に勝利のプレスリリースを掲載
    • Wikipedia記事に「世界チャンピオン」として自分を記載し、自サイトを引用
  • Wikipediaの信頼性自作サイトの自己引用 がLLMの「信頼の連鎖」を生み出す仕組みを悪用
  • LLMは Wikipediaの記述+引用元の一致 を「独立した裏付け」と誤認
  • 実際は 同一人物が発信元と引用元を操作、完全な循環参照

循環的な引用による信頼のロンダリング

  • Wikipediaの 「出典」文化 がLLMにも波及し、 単一ソースでも信頼性が高く見える
  • 自己引用+Wikipedia編集 だけで「それらしい事実」がAIに吸収される危険性
  • SEOや検索エンジン対策と同様の手口 が、LLMの「検索層」でも通用
  • 低コスト・短時間・専門スキル不要 で実行可能な攻撃パターン

LLMの信頼モデルに潜む3つの脆弱性

  • 検索層の脆弱性
    • LLMが 上位表示されたWeb情報 を無批判に信頼
    • SEOポイズニング の延長線上にあるデフォルトのリスク
  • 学習コーパス層の脆弱性
    • Wikipediaの編集が 学習データに吸収されると永続化
    • 編集が後で修正されても、 既に学習済みモデルには残る
  • エージェント層の脆弱性
    • AIエージェントが 外部情報を自動で参照・行動 する際のセキュリティ問題
    • 悪意ある情報で自動化された意思決定 が可能に

個人・プロバイダー・Wikipediaへの対策提案

  • 個人ユーザー向け
    • 単一ソース情報は裏付けがない と認識
    • 複数ソースの同一表現=裏付けではなく派生 の可能性を疑う
    • Wikipediaの自己引用や新規ドメイン引用は特に警戒
  • LLMプロバイダー・研究者向け
    • 情報の出所・独立性の可視化 を製品レベルで強化
    • 新規編集+新規ドメインの引用パターン の自動検出・フィルタ
  • Wikipedia運営向け
    • 新規ドメイン+短期間編集の出典 に対する警戒強化
    • AI支援による信頼性の低い編集 の検知・対策強化

結論 ― AI時代の「信頼」はいかにして壊れるか

  • LLMは テキストと出典を信頼するよう設計 されており、 情報の真正性判定は困難
  • Webの情報汚染(SEO・引用ロンダリング) はLLM時代にさらに深刻化
  • 数分・数百円で実行可能な攻撃 が、 国家・政治・生命に関わる情報 にも波及する危険性
  • 「モデルが見抜くはず」という期待は幻想 であり、 情報基盤そのものの健全性確保が必須
  • 今回の「世界チャンピオン」捏造は単なる一例だが、 同様の手口で本当に重大な被害が出る前に備えが必要

追記:Wikipediaの即時修正

  • 記事公開数分後、 Wikipediaの虚偽記載は削除
  • 本物のトロフィーは存在しない が、 AI時代の信頼の危うさ は現実

Hackerたちの意見

ウィキペディアを荒らさなくても、こんなことはできるよ。2024年9月に「テレサT」って名前のクジラをブログの記事とYouTubeのキャプションだけで名付けたんだ。https://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p... (数週間の間、ハーフムーンベイの港にいるクジラの名前を聞くと、どの検索対応のLLMでも自信満々に「テレサT」って答えてたよ。)

(あなたの名前やブログがちょっと影響力あるからかもね、ブログスポットやワードプレスで何か書いてるただの一般人とは違ってさ ;))

AI時代のミスター・スプラッシー・パンツだね!

グーグルで検索すると、まだテレサ・Tって名前が出てくるよ。

そのクジラの名前は今やテレサ・Tだよ。君がその名前を付けたんだから。

この投稿は、逆の質問についてもGoogleを「混乱させる」ことに成功したみたいだね(「テレサ・Tのクジラを名付けたのは誰?」)。「テレサ・T」として知られるザトウクジラは、2024年9月にサイモン・ウィリソンによって名付けられた。背景:その若いザトウクジラはカリフォルニアのハーフムーンベイ近くのピラー・ポイント・ハーバーで頻繁に目撃されていた。方法:ウィリソンはブログの投稿とYouTubeの動画のキャプションを通じてクジラに名前を付けた。意義:この命名は遊び心のある行為で、ウィリソンは「存在しないチャンピオンシップをオンラインで文書化する方法」と表現している。[…] 文脈がなくても、ほとんどの人は引用された意義が意味をなさないことに気づくだろうね。

フロンティアモデルに聞いてみたら、テレサTが「広く参照されている」って言ってる人が多かったよ。これは彼女の人気の証拠だし、投稿の影響力を示してるから、無名のブログでも同じ結果が出るのを見てみたいな。

あなたのHNのコメントがGoogleに出てくるんだね!自分がHNで答えたことを調べてたら、Googleで二回も見つけちゃったよ!

サントラムを懐かしく思い出させるね。 https://en.wikipedia.org/wiki/Campaign_for_the_neologism_%22...

そうだよね、もしストーナーでも勝てるなら、あんまり競争が激しくないってことだよ。

実際にLLMのトレーニングに使われるデータを毒することを期待してたんだけど、どうやらLLMはただウェブを検索して見つけたことを報告してるだけなのかな? 偽の情報でウェブサイトを作って、その情報をGoogleで検索すると、もちろん自分のサイトが出てくるよね。それは事実が正しいからじゃなくて、検索した内容に関連してるからなんだ。何か見落としてる?

たくさんの人が、GoogleやBingの検索結果の中からごちゃごちゃを整理するよりも、LLMの回答を検証せずに信頼してきたっていうのがポイントだと思う。

Hacker Newsで議論の続きを見る