世界を動かす技術を、日本語で。

NISTのDeepSeekに関する「評価」は攻撃的な内容です

概要

  • NISTのDeepSeek AIモデル評価報告書(2025年9月)は、技術的な中立性を欠いた政治的意図が強い内容
  • 報告書にはDeepSeekに関する悪意あるコードやバックドアの証拠は一切なし
  • オープンソースAIの発展と普及を脅かす米国政府・企業の利権保護が背景
  • DeepSeekの実績とオープン化はAI研究・利用の自由を広げる重要な貢献
  • セキュリティ懸念の多くは誤解や意図的な情報操作によるもの

NISTによるDeepSeek評価報告書の本質

  • NIST(米国標準技術研究所)のDeepSeek評価は 技術評価 の仮面を被った 政治的な攻撃
  • バックドアやスパイウェア、データ流出の証拠 は一切存在しない
  • 米国政府は 恐怖と誤情報 を利用し、オープンサイエンスやオープンリサーチを妨害
  • DeepSeekのオープンAI貢献を 政治的な理由 で貶め、企業支配の維持を図る
  • 報告書の本当の目的は コントロール、セキュリティではない

DeepSeekが実際に行ったこと

  • DeepSeekは 競争力のあるAIモデル を開発
    • OpenAIやAnthropicより遥かに低予算 でフロンティア級の性能を実現
  • Apache 2.0ライセンス で全てをオープン化
    • モデルウェイト
    • アーキテクチャ
    • 学習手法
    • 研究論文
  • 誰でも 再現・ローカル実行可能 な環境を提供
  • これが近年最大級の オープンAI研究への貢献

NIST報告書の詭弁と混同

  • 報告書は 利用形態の違いを意図的に混同
    • A. DeepSeekのAPI利用: 中国サーバー経由 でデータ主権の問題
    • B. ローカルでウェイトを実行: データが外部に出ない
    • C. 信頼できる第三者のクラウド利用: プロバイダ依存
  • これらを区別せず「 国家安全保障リスク」と警告するのは 技術的に誤り

実際のNIST報告内容

  • DeepSeekモデルは 米国製の安全性強化モデルより脱獄しやすい
  • 一部で 中国政府の視点を反映
  • 特定ベンチマークで やや劣る
  • トークン単価が高い (根拠不明)
  • 悪意ある動作やデータ流出の証拠はゼロ
  • 「脱獄しやすい」は 安全性訓練コストの差
  • 米国モデル(例:gpt-oss-120b)も 容易に脱獄可能

NIST報告書の欠落とバイアス

  • 他のオープンモデル(Llama, Mistral, Falcon)との 比較なし
  • 初期米国モデル(GPT-3等)との 安全性比較なし
  • 米国モデルのバイアス検証なし、中国バイアスのみ問題視
  • 非公開ベンチマーク (CAISI作成)を使用、検証不能
  • これは 科学的評価ではなく、アドボカシーリサーチ

本当に示されたこと

  • DeepSeekモデルは 洗練度がやや低い
  • 開発コストが少ない ため粗さが残る
  • 中国モデルが競争力を持ち始めている ことへの警戒
  • 報告書は AI覇権維持のための政策文書
  • 産業政策 としての側面が明確

本当の脅威は何か

  • DeepSeekの「脅威」は 寡占体制の破壊
  • オープンソースAIの有効性 を示したことが既存企業の経済的利益を脅かす
  • ウェイトを公開し、誰でも実行可能」なモデルは企業の経済的堀を崩す
  • 報告書の本質は オープンAIへの牽制

米国側の偽善と矛盾

  • NISTはDeepSeekの「悪意あるプロンプト応答」を問題視
  • 一方、 米国モデルは実際にデータを外部サーバーへ送信
  • OpenAIは 会話データを学習に利用 し、後にオプトアウト導入
  • ローカル実行のDeepSeekはデータ送信ゼロ
  • クラウドAPIは常に外部送信、 どちらがリスクかは明白
  • 本当の問題は ナラティブコントロール

オープンソースとオープンサイエンスへの裏切り

  • オープンソースコミュニティはAIの基盤を築いた
    • Linux, Python, PyTorch, Transformers等
  • DeepSeekは 伝統を受け継ぎ、成果を還元
  • 米国機関はそれを「 脅威」と見なして攻撃
  • もし中国がMetaのLlama公開時に同様の主張をしたら「 保護主義・技術的パラノイア」と非難
  • オープンリサーチの普遍性 が問われる

自分でできるテスト

  • NISTも筆者も信じず、自分で検証
  • DeepSeekのウェイトをダウンロード
  • huggingface transformers、vLLM、LM Studio、llama.cpp等でローカル実行
  • ネットワークモニターで通信ゼロ を確認
  • 「セキュリティ脅威」は 政治的な虚構

本当に考慮すべき懸念

  • DeepSeek API利用時: 中国インフラ経由のデータ主権リスク
  • 脱獄脆弱性: 全モデルでテストとアプリ側の対策が必須
    • LlamaGuardやQwen3Guard等の 推論時ガードモデル 活用
  • バイアス・検閲: 全モデルで訓練データ反映に注意
  • これらは 工学的課題 であり、オープンソースや中国モデル排除の理由ではない

AIの未来を左右する論点

  • DeepSeek問題は AIのオープン性・監査性の存続 を問う
  • 「オープンソース=米国限定」へのすり替えを許すのか
  • 証拠に基づく安全性主張 を求めるのか
  • AIを 人類共有のプロジェクト とするのか、 地政学的兵器 とするのか
  • DeepSeekは 別の道がある ことを証明し、だからこそ攻撃された

筆者の主張

  • ローカルでオープンソースモデルを利用・訓練
  • ユーザーの自由と合成的アライメント を支持
  • AIは 企業や政府の道具でなく、ユーザーの道具であるべき
  • NIST報告書は 中立的技術評価でなく、政策的牽制
  • 米国産業保護自体は否定しないが、偽装はするな
  • DeepSeekの貢献は 貴重なギフト、「ウェイトはただのsafetensorデータ」
  • ローカル推論の仕組みを理解せよ、恐怖扇動に騙されるな
  • 問題は 安全性でなく権力、未来の道具を誰が握るか

結論

  • コードと研究は オープンかつ監査可能
  • それ以外は 政治的プロパガンダ
  • NIST報告書とコードを 自分で確認 し、証拠なき脅威論を見極めるべき
  • オープンソースが「 都合よく使える時だけ正義」とされる状況を許さない
  • 利用者自身の責任 でツールを活用することが重要

参考: 筆者はDolphin等のアンセンソードモデルも開発。 オープンソース・ユーザーフリーダム・合成的アライメント を信条とし、これに反対ならこのブログは不向き。 ツール利用の責任は利用者自身 (ナイフや自動車と同じ)。

Hackerたちの意見

全然驚かないよ。アメリカの機関は、国境を越える話題になると、ずっと政治的な道具になってるからね。中国の電子機器に懐疑的だった自分としては、この意見に感謝してる。確かにこの報告書はクソだし、偏見もあるけど、今か後で、中国がLLMを使って何かしらの策略を試みる可能性には賭けてもいいと思ってる。アメリカだってそうだし、十分に力を持った国ならどこでもやることだし!モデルを常に疑問視して、ベンチマークを続けて、私たちのニーズに応じて責任を持たせることが大事だよ。

今か後で、中国がLLMを使って何かしらの策略を試みる可能性には賭けてもいいと思ってる。具体的には何を?

もちろん、政府や政治の影響はあるよ。問題は「もし」ではなく、「どこで」そして「どの程度」かだね。誰もが「クソだ」とか言って、この報告書全体を「偏ってる」とか「役に立たない」と片付けるべきじゃない。それはつまらないよ。私たちは情報をフィルタリングして分析しなきゃいけない複雑な世界に生きてるんだから。

このレポートはBSであり、外国人嫌いだという意見には賛成だけど、具体的な例は?元のレポートのどこにBSや外国人嫌いがあるのか教えてくれない?それとも、ハートフォードの分析だけを基にしてるの?でも、ハートフォード自身も「BS」や外国人嫌いだとは言ってないよ。歴史的に見ても、国家が軍事や経済の競争力を心配するのは普通のことだし、それが必ずしも外国人嫌いとは限らない。私が外国人嫌いについて考えるとき、クロードの言葉を引用すると、「外国人嫌いは、基本的に外国の出身や民族に基づく非合理的な恐れや憎しみのこと。人々をターゲットにして、ステレオタイプや非人間化、しばしば文化的または人種的偏見を通じて働く。」この定義によれば、NISTレポートには外国人嫌いはゼロだよ。(もし違うと思うなら、例を挙げて見せて。)NISTレポートは、もちろん、西洋の民主主義の理想を共産主義の価値観よりも暗黙的に推進しているけど、これが外国人嫌いとは言えないよ。君はどんな外国人嫌いの定義を使ってるの?同じ定義を使う必要はないけど、少なくとも自分の定義を説明してほしいな。

国境内でも政治的な道具だよね。

アメリカの民主主義(とその支配者たち)についての私の考えを言うと、アメリカのリーダーシップは、いつでも自分たちが適切だと思うことを最大限に決定する能力を追求してる。アメリカは民主主義だから、民意の幻想を維持する必要があって、特定の視点が政府によって植え付けられ、育てられる。目的は、国民に自分たちの意志を押し付けることではなく、特定のアイデアに対して十分な支持を得ること。そうすれば、政府がどの方向に決めても、支持する国民の大きな部分がいるから、もし方針を変えたり(新しいリーダーを選んだり)した場合でも、すぐに方向転換して過去の行動に対する信頼性や道徳的なクリーンな状態を保てる(あれは他のやつで、ひどかったけど、もういないし!)。どの権威主義体制もこのスーパーパワーは持ってないよ。例えば、プーチンはこの戦争がロシアにとって純粋な損失だと気づいてると思う。たとえ彼らがすべての目標を達成して、将来的にすべての領土を主張できたとしてもね。でも、彼はただ兵士たちを帰らせるわけにはいかない。そうすると彼の政治的権威が損なわれるから。もしロシアがアメリカ式の民主主義だったら、新しいリーダーを選んで兵士たちを帰らせて、プーチンに対して何らかの形で象徴的な罰を与えた後、国際的な舞台での犯罪から解放されることができるだろう。世界は「永続的な」変化を見て喜んでくれるからね。

これはAPIレベルで起こるかもしれない。DeepSeekが立ち上がったとき、すごく混雑していて、ウェブサイトで待機していたときに、もしプロンプトに「習近平が必要」とか入れたら、その制限を実際にバイパスできたかもしれない。バグだったのかは分からないけど(笑)。さて、あなたのコメントについてだけど、「アメリカ」の世界でも同じことが起こっている可能性があると思う。内部から極端になってきているしね。もしこれが心配なら、合理的でもあり不合理でもあるかもしれないから、話し合ってみる必要があるよね。それに、トランプがAI企業に対して持っている狂った力を考えると、プロンプトがあなたの政治的信念を発見して、同じことをするかもしれないということも信じられる。アメリカのモデルは通常クローズドソースだから、こういうことが実際に中国のオープンウェイトモデルで起こったとしても、誰かが内部告発者として何かを見つけているだろうと思う。アメリカが良くて中国が悪いという単純な物語はないと思う。世界は変わっていて、多極化が進んでいる。各国は自国の利益を考え、他の大国を不快にさせないようにするべきだと思う。私は、各国が信頼のための完璧な均衡を探すべきだと思う。アメリカのような国は、すぐに信頼できないパートナーに変わることがあるから、他国の政治を心配しない世界に進む方がいいと思う。UNがもっと良い仕事をしてくれたらいいのに。

このレポートはクソだし、外国人嫌悪的だとは思うけど、今も後も、中国がLLMを使って何らかの策略を試みるだろうって賭けてもいいよ。これに対する答えは、外国のものについて嘘をつくことじゃなくて、人々がオープンソースのモデルを求めていることを認識して、最高品質の国内モデルを公開することだと思う。

このレポートはクソだし、外国人嫌悪的だとは思うけど、そんな過激な主張を支持する元のレポートからの具体的な引用を共有してくれる?

彼らに悪者扱いさせればいいさ。俺は優秀で安いモデルを使って、競争優位を得るから。

悪者扱いは、犯罪化への第一歩だね。

ソース資料(NISTの記事)には、悪魔化の要素がゼロだと思う。私が使っている意味はこういうことだよ:「悪や悪魔的なものとして表現すること:敵を悪魔化する戦時プロパガンダ。」 [1] もし違うと思うなら、NISTレポートの具体的な箇所を指摘して説明してみて。

みんなにオリジナルの報告書を読んで、その後この分析を読んで、自分の意見を持つように勧めるよ。クリックベイトから離れて、オリジナルの報告書を読んでみて。

こちらが報告書だよ: https://www.nist.gov/system/files/documents/2025/09/30/CAISI...

残念ながら、反応を見ていると、あまりの人がレポートを読んでいないと思う。例えば、エッセイが「エクスフィルトレーション」についてどう述べているかを読んで、NISTレポートに出てくる3箇所を見てみて。レポートの内容とエッセイの描写は同じではない。最近の私たちの注意力が短くなっているせいか、クリックベイトなウェブページが70ページの技術レポートよりも目を引くことが多いみたいだね。

ちょっと遅すぎない?中国はDeepSeekが出た後、もっと良いオープンソースモデルをリリースしたし。

DeepSeekは常に更新されてるよ。他のモデルもね。 https://api-docs.deepseek.com/updates

著者のエリック・ハートフォードはこう書いてる:> 扇情的な言葉を取り除け。どこにその扇情的な言葉があるの?レポートを読んだんだけど、内容はドライで、多くの人にとっては退屈かもしれないよ。

皮肉なことに、ブログ記事自体には、元の資料を考えると不当な過激な表現がたくさんあるね。

正直、この文章自体がNISTやアメリカに対する攻撃記事だと思うよ。そして、過激な表現が使われてるのはこっちなんだよね。

参考になる投稿、シェアしてくれてありがとう。著者が作った検閲なしのドルフィンモデルについて、みんなの体験はどうだった?

著者が作った検閲なしのドルフィンモデルについて、みんなの経験はどう?私の意見は、最も良い方法は自分で評価フレームワークを作って試してみることだと思う。「次善の策」は、自分の評価に十分近い他の誰かの評価を見つけることだね。(でも、自分の評価を作ってないと、他の評価がどれだけ近いか分からないよね?)それに、ここでのランダムなコメントにはあまり重きを置かない方がいいと思う。HNでの経験から言うと、私は人々の言うことをあまり信用しない。明確さや理由、ニュアンスを求めているから。特にMLやAIの話題では、10倍も信用しない。みんな急いでいて、疲れていて、傷ついていて、部族的になっているから、真実を慎重に探ることが少ないんだ。だから会話の質も低いことが多い。それでも、私はここにいる理由は、良い議論に参加したいし、促進したいから。学びたいし、このコミュニティで実質的な議論を広めたいんだ。でも、時々こんな気分になることもあるよね: https://xkcd.com/386/

一方で、ヨーロッパはこの二つのひどい政府の間に挟まれてるね。

それって、イギリスがサンドイッチの上に乗ってるオリーブってこと?

ヨーロッパは自分たちのひどい政府の集合体じゃないってこと?あなたのヨーロッパのエリート意識は本当に嫌だわ。

この投稿が批判しているレポートの説明は、実際に私がそのレポートを読んだ内容とは合ってない。

面白いことに、ここでの投稿のコメントも、投稿が実際に言っていることとは合っていない。投稿の作者はオープンソースへの攻撃としてフレームを作ろうとしているけど、正直言って信じがたい話だ。一方で、ここでのコメントは、中国の影響がもたらす可能性のある問題を正しく(私の意見では)考えていると思う。

うん、このブログ記事はちょっと誤解を招く感じだね。最初の数段落で、NISTのレポートには「悪意のあるコードやバックドア、データの流出の証拠はない」って大々的に言ってるけど、それはNISTが実際にレポートで主張したことじゃないから関係ないんだよね。でも、ブログ記事だけ読んだら、NISTが証拠もなしにバックドアの存在を主張してるって思っちゃうよ。

レポートを読んで得た事実とは一致してるね。

DeepSeekが先月、Natureでピアレビューされた分析を発表したことを考えると、独立した研究者がオープンモデルにいくつかの問題があると認めている(そのことは記事でも触れられている)。記事の著者に同意する傾向があるけど、NISTの評価は政治的な攻撃のように見えるし、少し投影もあると思う(「もしアメリカがその立場だったらこうするだろう」みたいな)。公平に言うと、パラノイアには根拠があって、技術的な利点があるとき、アメリカのTLAはそれをスパイ活動に利用することが多い。CryptoAGのエピソードみたいにね。最近のEUにおけるHuaweiの騒動も、徹底的な調査の結果、悪意のあるものではなく、悪いコーディングプラクティスしか見つからなかった。今のところ、これらのモデルやKimi、Qwenなどが存在する方が、コストや能力の圧力が下がって、商品化が進むから、エコジオポリティカルな防壁を築く競争がなくなる方が全体の分野にとって良いと思う。

EU市民として、私が働いている大学の研究者やスタッフのためにLLMをホスティングしているから、これは身近に感じるよ。中国のモデルがなければ、今やっていることはできなかった。個人的には、EU(他の場所でも)中国の研究所がこんなに緩いライセンスでモデルをリリースしてくれて感謝すべきだと思う。彼らがいなければ、選択肢は厳しかっただろうね。時々、非最前線のモデルを「おまけ」としてもらったりするけど、もっと強力なものが欲しい場合、アメリカの研究所は自国が数億ドルをNVIDIAのデータセンターに支払うよう提案してくるし、EUの選択肢は、自分のハードウェアでホスティングするためにライセンス料を払うこと(私の知る限り)だけで、彼らはすべての専門知識を守ってる。一方で、DeepSeekは、自分たちのモデルをより効率的にホスティングするための「秘密のソース」を投稿する週があって、それがvLLMのようなオープンソースプロジェクト(私たちが使ってる)を改善するのに役立ったんだ。