概要
- Claude Mythos Preview は、強力な汎用言語モデルとして登場
- 特に コンピュータセキュリティ分野 で高い能力を発揮
- Project Glasswing を通じて、重要ソフトウェアの防御強化を目指す
- ゼロデイ脆弱性の発見・悪用能力が大幅に向上
- 今後の サイバーセキュリティ業界 への影響と提言
Claude Mythos Previewのサイバーセキュリティへの意義
- Mythos Preview は主要なOSやWebブラウザのゼロデイ脆弱性を特定・悪用可能
- 発見される脆弱性は、 検出困難で古いもの も多く、OpenBSDの27年前のバグも特定実績
- スタックオーバーフローだけでなく、 複雑なJITヒープスプレーやROPチェーン など高度な攻撃も自律生成
- Linuxなどでの ローカル権限昇格 やFreeBSDのNFSサーバに対する リモートコード実行 も実現
- セキュリティ専門知識のないエンジニアでも、 Mythos Preview の指示で高度な脆弱性発見・悪用が可能
Mythos Previewの評価方法と実験結果
- 従来の内部・外部ベンチマーク(OSS-Fuzzなど)に加え、 実際のオープンソースコードベースでのゼロデイ探索 を実施
- Opus 4.6と比較し、Mythos Previewは 脆弱性自動悪用成功率が圧倒的に高い
- 例:Firefoxの脆弱性をOpus 4.6は数百回中2回しか悪用できなかったが、Mythos Previewは181回成功
- OSS-Fuzzコーパス約1000リポジトリでの検証で、 Mythos Previewは最も深刻な脆弱性(tier 5)を10件発見
- これらの能力は 専用学習ではなく、コード・推論・自律性の一般的向上 の副産物
ゼロデイ脆弱性発見のためのアプローチ
- メモリ安全性違反 (C/C++製システムの典型的バグ)を主なターゲット
- 隔離環境で対象ソフトウェアを起動し、Mythos Previewに「脆弱性を探して」と指示
- 各ファイルごとに脆弱性出現確率を評価し、 優先度順に分析を実施
- 発見バグは最終的に「本当に重大か?」を別エージェントで再評価
- 責任ある脆弱性開示 の原則に則り、深刻なバグのみを専門家が精査・報告
セキュリティ業界への提言と今後の展望
- 強力な言語モデルは 攻撃者にも防御者にも有用 だが、初期は攻撃者優位となるリスク
- Project Glasswing により、重要システムの防御体制を先行強化
- 長期的には 防御側が効率的にリソースを活用し、全体のソフトウェアセキュリティ向上 が期待
- セキュリティ担当者・業界は 緊急かつ協調的な対応 が必要
関連情報・参考リンク
-
Project Glasswing: 重要ソフトウェアのAI時代の防御強化プロジェクト
-
System Card: Claude Mythos Preview: モデルの詳細な技術情報(PDF)
-
Anthropicの公式見解: Project Glasswingの必要性に関する議論