世界を動かす技術を、日本語で。

Anthropicの安全性のスーパーパワー

2026年6月15日原文(stratechery.com)

概要

  • Anthropicのモデルリリースを巡る論争と慎重な公開戦略
  • Fable/Mythosモデルの高性能と安全性への懸念
  • 米政府による輸出規制とAnthropicの対応
  • AI業界における経済的・データ的・権力的インセンティブ
  • モデル開発とユーザー接点の競争激化

Anthropicのモデルリリースと論争

  • Anthropic の公開声明がマーケティング目的の 危機感煽り と批判される現状
  • 2ヶ月前に Mythos Preview を「危険すぎて一般公開不可」と発表
  • 直後に安全ガードレール付きの Fable を一般公開
  • Fable は他の先端モデル( GPT 5.5Opus 4.8)を凌駕する印象
  • Fable は新世代の大規模事前学習モデルの可能性
  • Fable/Mythosの セキュリティ脆弱性発見能力 が高く、慎重な公開は妥当との見解

モデル公開と政府規制

  • 公開モデルのガードレールは jailbreak (回避)が可能
  • Fable 5公開直後に jailbreak が発生
  • 米政府が 国家安全保障 を理由にFable 5とMythos 5の全外国人利用を即時停止命令
    • Anthropicは全顧客向けにサービス停止を実施
    • 他のモデルには影響なし
  • Amazon がjailbreak技術を報告、Anthropicへの投資家でもありインフラ提供者
  • Anthropic幹部が ワシントンD.C. で政府と協議中
  • 政府とAnthropicの対立は必然、モデルの強力さが問題ではなく「次世代」への警戒感

CynicismとAnthropicの独自性

  • Mythosが危険ならなぜ Fable を公開し、政府と争うのかという疑問
  • Anthropicの行動は理解できるが、その正当化が批判と魅力の源泉

経済的インセンティブ

  • AI初期は コンピュート (計算資源)に価値集中
    • Nvidia, TSMC, SK hynix, Samsung, Micron が恩恵
  • AnthropicやOpenAIは巨額投資も オープンソース で差別化消失リスク
  • モデルがコモディティ化すれば、価値は ユーザー接点 へ移行
  • ソフトウェア企業 とフロンティアAIラボがユーザー接点を巡り競合
  • Nadella(Microsoft CEO)は「 人間資本トークン資本」の共進化を提唱
    • AIモデルの独占による産業空洞化を警告
    • だが現実には グローバリゼーション 同様、集中化が進む可能性

データ取得のインセンティブ

  • モデル進化には より良いデータリアルな利用データ が不可欠
  • OpenAIやAnthropicが 格安サブスクリプション 提供で利用データ獲得
    • $200で$8,000相当のClaudeトークン、$14,000相当のCodexトークン
  • Fableでは 30日間の利用データ保持 方針へ変更(エンタープライズも含む)
    • 将来的な学習利用の可能性を排除せず
  • ユーザー接点の拡大が データ収集の好循環 を生む
  • Nadellaはデータ独立性の重要性を強調
    • 企業固有の知識やワークフローをAIに反映し、 独自IP として蓄積
  • Anthropicのデータ方針を受け入れる企業が短期的に優位となる可能性
    • 拒否する企業は新規参入やAIラボに市場を奪われるリスク

権力的インセンティブと運用制限

  • Fable/Mythosの データ保持方針 以上に物議を醸す運用制限
  • AnthropicはLLM開発目的の利用を サイレントで性能劣化 させると明言
    • 競合モデル開発への利用を抑止
    • システムカードで詳細を公開

まとめ

  • Anthropicのモデル公開は 安全性・経済性・データ収集・権力維持 の複雑なバランス
  • AIモデルの公開・規制・運用を巡る 企業と国家・業界間のせめぎ合い
  • 今後も データとユーザー接点 を巡る競争激化が予想される

Hackerたちの意見

そのために、Fable/Mythosがセキュリティ問題を特定して活用する能力が実際に高いというのは納得できる。これについては以前にも取り上げられているね。 Anthropicの慎重な展開は正当化されている。ただ、モデルを公開する問題は、ガードレールが破られる可能性があることで、実際にリリース直後にそれが起こったみたいだ。未来は均等に分配されていない。Anthropic、特にAmodieは、言葉を使って未知の部分を少しコントロールできると考えているようだ。彼らは自分たちが作った製品に導かれているのかもしれない。 *AIは間違いを犯すことがある。Project Glasswingのくだらなさはそれを物語っている。企業は私たちの注意、インターネット、そして今や思考をも支配している。そろそろ取り戻すべきだと思う。

あなたがリンクしたAISLEブログのその議論のトップコメントには、そのブログ投稿に対する強力な反論があるよ…

アンスロピックが発表で示した特定の脆弱性を取り上げて、関連するコードを分離し、小さくて安いオープンウェイトモデルでテストしたんだ。オープンウェイトモデルをコードベースに対して使って脆弱性を探したわけじゃないよ。

(再投稿) 私の理解では、ITAR規制がすべての形態のMythosに適用されたようです。これらはアメリカの国務省と商務省が監督していて、外国人がアメリカ国内外でMythosにアクセスすることを禁じています。今では、アメリカ市民と「グリーンカード」を持つ移民だけがMythosにアクセスできるようです。どうやらAnthropicはこれらの制限を実施する内部管理がないようで、唯一の選択肢はMythosをシャットダウンすることでした。ITAR違反の罰則は、違反ごとに最大10年の懲役と100万ドルに達することがあります。(興味があれば、その詳細へのリンクを投稿できます。)Anthropicがアメリカの企業である限り、これから逃れることはできません。

これが今のアメリカ政府のビジネスのやり方だ、気まぐれで復讐的だ。武器システムにおいてClaudeの改変版を使わせなかったことへの教科書的な報復だ。これにより、アメリカの閉じられたモデルは外国企業にとって無用の長物になってしまう。OpenAIやGoogleにも起こり得る。企業が望むように行動しなかったから引き抜かれるリスクが大きすぎる。Kimi、Z、Deepseekが前面に出る時が来たようだ。彼らは数ヶ月で追いつくだろうし。Kimiのコード2.6はめちゃくちゃ良いよ。

アンスロピックは別の国に移転できるのかな?

この「アメリカ人」制限って、正直よくわからないんだよね。アメリカには3億5000万人もいるし、大半は市民やグリーンカード保持者だし、外国の勢力に働いてる人もいるんじゃないかな。

アンスロピックがアメリカの会社である限り、これから逃れることはできないね。RISC-V財団がスイスに移転した時のことを思い出す。あの時、バカな共和党員たちがオープンで世界中で使われている仕様に輸出制限をかけようとしたんだ。パンドラの箱は開いちゃったし、もう閉じることはできない。優れたAIモデルはどこにでも存在することになるよ。

彼らはアメリカを離れることを考えるべきかもしれない。明らかに、腐敗した独裁政権への堕落が現実の影響を及ぼしている。

他の場所に、Anthropicがモデルを訓練し推論を行うためのインフラはあるのかな?

いや、トランプ政権とのあの早い段階の対立は、アンスロピックにとって最高の出来事だったよ。それまでは、クロードは開発者の間では知られてたけど、一般の人にはあまり知られてなかった。アンスロピックが「トランプが嫌ってるから、絶対に良いものだ!」っていう承認を得た後、会社の認知度と人気は急上昇したんだ。これも、彼らにとって良い結果になると思う。禁止令は、数週間後に「すごい取引」で解除されるだろうし、アンスロピックは「トランプが禁止しようとしたから、世界で最も進んだAIモデルを持っているに違いない!」っていう承認をIPOの直前に得ることになる。これらは全部、プロレスの演出みたいなもんだよ。

どこに行くんだろう? 1) アメリカが全力でそれを防ごうとするのは間違いないし、アンスロピックがデータやコード、モデル、人材を持ち出すことに成功したとしても、すぐにアメリカの企業が彼らと関わるのを禁止するだろうね。だから、自国のコンピューティング環境や、グーグル、アマゾン、マイクロソフト、xAI、メタなどからもブロックされることになる。2) どこに行くのか? 中国かもしれないけど、アンスロピックのニーズに見合うコンピューティング能力はないみたいだ。EUもアメリカと同じか、それ以上に厳しい規制があるし、EUはAIの革新で賑わっているわけじゃない。中東のいくつかの国はお金やエネルギー、そういうポジションを確保する興味があるかもしれないけど、コンピューティング能力がない。さらに、アメリカは彼らを受け入れる国や地域に対して直接行動を起こすだろうし、経済的にもそうだ。3) それから、他のところでも言ったけど、アメリカは彼らが安全な場所を見つけたら、GPUの販売をブロックして、必要なコンピューティング能力の蓄積を防ぐだろうね。

Hacker Newsで議論の続きを見る