世界を動かす技術を、日本語で。

プロジェクトグラスウィング:初回アップデート

2026年5月23日原文(anthropic.com)

概要

  • Project Glasswing は、AIによるソフトウェアセキュリティ向上を目指す共同プロジェクト
  • Claude Mythos Preview を活用し、世界中の重要ソフトウェアから多数の深刻な脆弱性を発見
  • 脆弱性の発見速度が向上した一方、 検証・開示・修正 が新たなボトルネックに
  • オープンソースや主要インフラへの影響と、今後の対応策を解説
  • サイバー防御の新たな課題と適応策 についても提言

Project Glasswingの進捗と初期成果

  • Project Glasswing は、AI技術を活用し、世界で最も重要なソフトウェアのセキュリティ強化を目的とした取り組み
  • 50社のパートナー と連携し、 Claude Mythos Preview で1万件以上の高リスク脆弱性を発見
  • 従来は脆弱性の発見が進捗の制約要因だったが、現在は 検証・開示・修正作業 が新たなボトルネック
  • 公開情報は 90日ルール (発見から90日後に開示)に則り、ユーザー保護を優先
  • パートナー企業(例:Cloudflare、Mozilla、Oracleなど)で バグ発見率が10倍以上 に向上

Mythos Previewの性能と外部評価

  • Cloudflare では2,000件のバグ(うち400件が高リスク)を発見、誤検知率も人間より低水準
  • UK AI Security InstituteMozillaXBOW など第三者機関からも高評価
  • ExploitBenchExploitGym といった学術ベンチマークでも最高性能を記録
  • Palo Alto NetworksMicrosoftOracle などでパッチ配布のスピードが大幅向上
  • 金融機関での 不正送金防止 など、他分野のセキュリティにも応用実績

オープンソースソフトウェアへの影響

  • Anthropic は過去数ヶ月で1,000以上のオープンソースプロジェクトをスキャン
  • 6,202件 の高・重大リスク脆弱性を特定、1,752件を外部セキュリティ企業が精査
    • そのうち90.6%が真の脆弱性、62.4%が高・重大リスクと判定
  • 例: wolfSSL (世界中で利用される暗号ライブラリ)で証明書偽造を可能にする脆弱性を発見・修正
  • 修正作業のボトルネックは 人的リソース であり、報告・パッチ設計・配布に時間を要する
  • パッチ済み脆弱性はまだ少数だが、今後増加見込み

脆弱性トリアージと開示プロセス

  • 発見脆弱性は 外部専門家または自社で再現・再評価
  • 実在が確認された場合、既存修正の有無をチェックし、詳細レポートを作成
  • オープンソース開発者の負担増加に配慮し、 開示速度の調整直接開示 も実施
  • これまでに 530件 の高・重大リスク脆弱性を開示、75件がパッチ済み
  • パッチ数が少ない理由は、開示から修正までの 90日ルール や非公開パッチ、セキュリティ業界全体の処理能力不足

サイバーセキュリティの新たな課題と適応策

  • Mythos Preview レベルのAIモデルが今後広く利用可能になる見通し
  • 脆弱性発見からパッチ適用までの タイムラグ が攻撃リスクを拡大
  • 開発者・利用者は パッチサイクル短縮アップデート促進 が必須
  • ネットワーク防御担当者 は、パッチテスト・展開の迅速化や多要素認証・ログ管理など基本対策の徹底が重要
  • Anthropicは AI活用のツールや研究成果 も公開予定

まとめと今後の展望

  • AIの進化 により、ソフトウェア脆弱性発見が劇的に加速
  • 修正・パッチ適用の効率化が今後の最大課題
  • ソフトウェア業界全体での 協調的な対応 と、 AI技術の積極活用 が不可欠
  • Project Glasswingは今後も 詳細な技術分析やツール提供 を継続予定

Hackerたちの意見

今日は楽しい一日だったよ。deepseek-v4-flashのサブエージェントを使って、AF_ALGが無効でnscdがオンのシステム用にdirty fragのパッチを作ったんだ。ルートアクセスを得るためにね。元々公開されてたエクスプロイトはうまくいかなかったけど、パッチを当てたやつはバッチリ動いた。俺は、十分な知能を持った100のサブエージェントがmythosと同じ結果を出せるって信じてるんだけど、実際にmythosを試したらその意見が崩れるかもしれないな。他の人たちもmythosを試したことがあると思うよ。

それは多分そうだね。でも、100のサブエージェントを使うってなると、運用コストが1時間あたり100ドルになるし、Mythosは脆弱性を見つけるのに2万ドルかかるから、問題は「もっと馬鹿なモデルでもできるのか?」じゃなくて、Mythosでエクスプロイトを見つけるのに5000 GPU時間かかるとしたら、もっと馬鹿なモデルだとどれくらいのGPU時間がかかるのかってことだね。

今日はCodex Securityを使ってみるといいよ。実験的にオンにしたら、1週間も経たないうちにみんなにとって欠かせないものになった。どれだけ正確かに驚いたし、既存のコードにどれだけのセキュリティ問題が見つかったか、コミットするたびにどんどん見つかるし、誰もがこういうミスをするんだってことに気づかされた。俺たちにとっては約90%の精度だね。「Low」の発見でも掘り下げてみると、実は悪用できることが多い。誰でもミスをするんだよ。最もジュニアな人からシニアな人までね。結局、バグの一種だから。これからはこういうツールが開発ライフサイクルの一部になると思う。AIでコードを書いて、AIでレビューして、AIで脆弱性を探す。完璧じゃなくても、コストに見合う価値はあると思う。自分のリポジトリ用に何かを早めに有効にすることを強くおすすめするよ。

gpt-5.5-cyberをオーケストレーターにして、deepseek-v4-flashや他の速くて安いモデルをワーカーとして使うセットアップを試してみることをおすすめするよ。このセットアップでかなり良い結果が出てる。

同じ経験をしたよ。UIがちょっと分かりづらいんだけど、5回スキャンできるって書いてあるけど、1回のスキャンはリポジトリのデフォルトブランチの継続的な監視なんだ。高インパクトの発見はほとんどが的確だった。特に驚いたのは、高品質なドキュメントが生成されることと、提案される修正がどれだけ具体的かってこと。Codexはもっと多くのコードを生成することが多いけど、セキュリティモデルは頻繁に10行未満の修正を提案して、正確な場所を狙ってる。本当に良いと思う。ベータ版が終わったらかなり高くなると思うけど、ビジネスとしてはこれに飛びつくべきだね。

これからはこういうツールが開発ライフサイクルの一部になると思う。AIでコードを書いて、AIでレビューして、AIで脆弱性を探す。完璧じゃなくても、コストに見合う価値はあると思う。じゃあ、これはどう機能するの?Claude Codeがセキュリティバグを生成して、Claude Securityがそれを見つけて、Claude Codeが修正を生成して、トークンを使って利益を得るってこと?

PEファイルを扱う多くのセキュリティツールの依存関係として使われているプロジェクトのメンテナンスを手伝ってるんだけど、AnthropicとOpenAIがオープンソースのメンテナンス用プログラムへの応募に対して全く反応しなかったのは残念だね。私の視点から見ると、彼らのオファーは主に有名なプロジェクト向けで、月に数百万のインストールがあるけど、人気ツールの依存関係として「隠れている」ために何千ものスターを得られないプロジェクトにはあまり関心がないように見える。

LLMの一つの問題は、「安全性」の名のもとに余計なコードを追加して、昔は役立ったけど今は標準ライブラリで正しく処理されているものを自信満々に生成することだと思う。コードに関しては「少ない方が良い」という意見なので、こういうトレンドにはちょっとイライラしてる。どうやってこの落とし穴を避ける?

どれだけ正確か、既存のコードでどれだけ多くのセキュリティ問題を見つけたか、コミットするたびにどうやってそれを見つけ続けているか、そして誰もがこういうミスをすることから免れないっていうのに驚いたよ。毎日不安定なコードをプッシュしてるって、スキルだよね!

mythosに関しては、ただの公的なモデルでガードレールもないっていうシニシズムが多いけど、これを見てほしい: 「1,752の高評価またはクリティカル評価の脆弱性が、6つの独立したセキュリティ研究会社のうちの1つによって慎重に評価されました。これらのうち、90.6%(1,587)は実際に有効な真のポジティブであり、62.4%(1,094)は高またはクリティカルな重大度として確認されました。」opus、codex、またはossモデルを使って脆弱性スキャンを行った人には、真のポジティブ率と発見量が明らかに変わったことが分かるはず。Glasswingの約50のパートナーは、ほとんどが他のモデルでハーネスを運用していて、「うわ、すごい」と言っている。今の質問は、アクセスの第2、第3フェーズがどのようになるか、どのシステムクラスを保護するかを決めることだ。ルーター、ファイアウォール、SaaS、ERPシステム、工場のコントローラー、SCADAシステム、ゼロトラストVPNゲートウェイ、通信機器やネットワーク、医療機器など、やるべきことがたくさんある。だから、mythosは当面プライベートのままだと思う。保護すべき面が広すぎて、トリアージ、修正、展開することが多すぎる。これはAnthropicにとっても、プライベートモデルは蒸留できないから都合がいいかも。発見、トリアージ、修正データからのモデル改善の効果もあるし、これはおそらく今まで集められた中で最も強力な攻撃データのコーパスだと思う。中国の企業がすぐにアクセスできるとは思えないし、今後も無理だろうね。CISAが監査を義務付ける世界がすぐに来ると思うし、mythos-proofのVPNゲートウェイや家庭用ルーターを買うにはアメリカ製を買わなきゃならないだろうね。

これが私が神話が当面プライベートのままであると信じる理由です。守るべき大きな面があって、トリアージや修正、デプロイすることがたくさんあるんです。はぁ、GPT-2の頃を思い出します - OpenAIが「人類はまだ準備ができていない」と言ってモデルへのアクセスを制限した最初の時でした。そのモデルは詩を書くのが得意でした。それ以来、OAI/ANTからのモデル発表で似たような言葉を使わなかったものは一つも覚えていません。いわゆるモデル発表のリークはマーケティングであり、それが危険だというのもマーケティング、世界がそれに対して準備ができていないというのもマーケティングです。そして、アクセスを与えられた人たちが「おお、すごい」と言っているのも、信じるかどうかは別として、マーケティングです。すべてがマーケティングです。すでに一般に利用可能なトップ5/10のモデルから同じ結果を得ることができます。神話はAnthropicが新しいアイデアを売るための方法で、前のものは民主化されてしまったからです。

アメリカのセキュリティ会社に外注できない理由がわからないな。

Hacker Newsで議論の続きを見る