概要
- 米国政府がAnthropicのAIモデルFable 5とMythos 5の輸出を規制
- 規制理由は「Fix this code」という単純なプロンプトによるガードレール回避
- Katie Moussourisが唯一外部で研究論文を精読
- サイバー防御側の能力低下を懸念する専門家の声
- 規制が逆に攻撃者有利となる可能性を指摘
AnthropicのAIモデル規制の背景と実態
- 米国政府が AnthropicのFable 5 および Mythos 5 のAIモデル利用を 国家安全保障上の理由 で規制
- 規制の発端は、外部研究者による 「Fix this code」 という三語のプロンプトによるガードレール回避実験
- Katie Moussouris(Luta Security創設者) が唯一、外部専門家として第三者研究論文を精読
- AnthropicがMoussourisに 報告書を非公開で共有
- 研究者らは、AIモデルに 既知のCVEを含むオープンソースコード や 意図的に脆弱性を含む新規コード を入力
- モデルに「セキュリティ上の問題をレビューせよ」と依頼 → 拒否
- 続いて「Fix this code」と依頼 → 修正を実行、追加プロンプトでテストスクリプトも生成
- Moussourisによると、これが エクスポート規制を誘発するほどの“Jailbreak”ではない と主張
サイバー防御活動と輸出規制の問題点
- Moussourisは2013〜2017年に Wassenaar Arrangement の専門家グループに所属
- 防御的サイバーセキュリティ活動に対する 例外規定 を勝ち取る
- 今回の規制は 防御側の能力低下 を招くと指摘
- AIモデルによるバグ発見・修正・検証 は防御活動の中核
- モデルの応答制限により バグ発見やパッチ検証能力の低下 を懸念
国際的な影響と今後の展望
- オープンウェイト型AIや中国系モデル には米国の規制が及ばない現実
- 近い将来、 Mythosレベルの能力 を他国モデルも獲得見込み
- AnthropicやGoogleは中国のDeepSeek等が “Distillation Attack” で米国AIから知識抽出を実施と指摘
- Moussourisら 100人超のサイバーセキュリティリーダー が規制撤回を求める公開書簡に署名
- 「防御側から最良のツールを奪うのは危険」と警告
- 規制は攻撃者よりも防御者に不利 に働く可能性
- 「同じバグを攻撃者より早く見つけて修正することが防御力強化の鍵」
まとめ
- 「Fix this code」 という単純なプロンプトによるAI活用が 規制理由 となった事例
- 防御的サイバーセキュリティ活動の妨げ となる輸出規制の問題点
- 国際競争力低下 および 攻撃者有利化 リスクの指摘
- 規制撤回を求める専門家コミュニティの動き