概要
- Anthropicの新LLM「Mythos」がセキュリティ分野で高い性能を示す。
- セキュリティ強化には攻撃者より多くのトークンを使う必要性。
- OSSの重要性と攻撃対象としてのリスクが増大。
- 開発工程に「ハードニング」フェーズが加わる可能性。
- セキュリティコストは市場の需給で決まる構造。
セキュリティは攻撃者より多くのトークンを消費する競争か
- AnthropicのMythos は、コンピュータセキュリティ分野で「極めて高い能力」を持つLLMとして発表。
- 公開は限定的で、重要なソフトウェア開発者のみに提供、システム強化の猶予期間を確保。
- AI Security Institute (AISI) によるサードパーティ分析でも、Mythosの性能を裏付ける結果。
- 「The Last Ones」シミュレーションでは、32段階の企業ネットワーク攻撃を再現し、Mythosのみが10回中3回の完遂に成功。
- 1回の試行あたり 1億トークン (約$12,500)を消費、10回で$125,000のコスト。
- 100Mトークン消費でも成果の逓減は見られず、「トークンを投下し続ければ進展し続ける」傾向。
- セキュリティ強化は「攻撃者が使うトークン以上にトークンを費やす」ことが勝敗を分ける単純な数式に。
- これは Proof of Work 型の暗号通貨と類似、計算資源を多く投入した方が勝つロジック。
- セキュリティは「知恵」より「資金力」の勝負に転換。
OSSとエージェントコーディングの新たな課題
- OSS(オープンソースソフトウェア) の重要性が一層高まる一方、攻撃対象としての価値も上昇。
- OSSライブラリを利用する企業が十分なトークンを投入すれば、個別実装より安全性が高まる可能性。
- ただし、OSSは利用者が多く、攻撃者も高いリターンを求めて多くのトークンを投下しやすい。
- 依存パッケージの再実装 や、LLMによる簡易機能の「yoink」手法への再評価も進行。
- Linusの法則「十分な目があればバグは浅い」も「十分なトークンがあればバグは浅い」に拡張。
ソフトウェア開発プロセスの変化
- 開発工程 が「開発」「レビュー」に加え「ハードニング(脆弱性検出)」の三段階に進化。
- 開発:人間の直感やユーザーフィードバックで機能実装・反復
- レビュー:ドキュメント整理やリファクタリング、ベストプラクティス適用
- ハードニング:予算が尽きるまで自動で脆弱性探索
- 最初のフェーズは人間のリソースが制約、最後は資金力が制約となる性質。
- 以前はセキュリティ監査が「稀で一過性」だったが、今後は「常時・最適予算内で」実施可能に。
- コード自体は安価だが、 安全性確保には高コスト が発生。
- モデルの最適化でコスト低減が進んでも、「成果の逓減点」に達しない限り、攻撃者以上にトークンを消費する必要がある。
- 脆弱性の市場価値 が、セキュリティコストの上限を決定。