世界を動かす技術を、日本語で。

プロジェクトグラスウィング:AI時代のための重要なソフトウェアの確保

2026年4月8日原文(anthropic.com)

概要

  • Project Glasswing は主要IT企業が連携し、AI活用によるサイバーセキュリティ強化を目指す新イニシアチブ
  • Anthropicの Claude Mythos Preview が脆弱性発見能力で注目、既に多数の重大バグを自律的に特定
  • 40以上の重要ソフトウェア開発組織にAI活用の機会を提供、オープンソース支援も推進
  • AIの進化 により攻撃・防御の両面でサイバーリスクが急増、早急な対応が不可欠
  • 産業全体・政府・オープンソースの協調による 持続的な防御体制 構築が急務

Project Glasswingの発足と目的

  • Amazon Web Services、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks などが参加する大規模サイバーセキュリティ連携プロジェクト
  • Anthropicが開発した Claude Mythos Preview という最先端AIモデルの活用による防御力強化
  • Mythos Previewは、 高度な脆弱性発見・悪用能力 を持ち、既存の自動テストや人間のレビューを超える成果を実証
  • サイバー攻撃者に先んじてAIを防御に活用することが急務であり、 業界横断的な協力 が不可欠
  • Anthropicは 1億ドル分の利用クレジット400万ドルのオープンソース支援金 を提供

AI時代のサイバーセキュリティ課題

  • 銀行、医療、物流、電力など社会基盤 を支えるソフトウェアの脆弱性問題
  • 国家規模の攻撃(例: 中国、イラン、北朝鮮、ロシア)や、病院・学校への小規模攻撃も深刻な被害をもたらす現状
  • サイバー犯罪の世界的被害額 は年間5000億ドル規模と推定
  • これまで発見困難だった脆弱性も、 AIモデルの進化 で低コスト・短時間で発見・悪用が可能に
  • Claude Mythos Preview は、数十年発見されなかった脆弱性も自律的に特定可能

Claude Mythos Previewによる脆弱性発見事例

  • OpenBSD で27年間未発見だったリモートクラッシュ脆弱性の特定
  • FFmpeg で16年間見逃されていた脆弱性の発見、従来の自動テストでは検知できなかった事例
  • Linuxカーネル における複数の脆弱性連鎖による特権昇格の自律的発見
  • これらの脆弱性は既にメンテナーへ報告済み、パッチ適用完了
  • CyberGymベンチマーク での成果:Mythos Preview 83.1%、Opus 4.6 66.6%と大幅な性能差

主要パートナー企業のコメントと評価

  • Cisco :「AIによる基盤防御の緊急性が増し、従来の手法だけでは不十分。Glasswing参加は不可欠」
  • AWS :「AIを活用した継続的な防御体制構築、Claude Mythos Previewの実運用で成果」
  • Microsoft :「AI活用によるリスク低減と顧客保護、セキュリティベンチマークでの性能向上」
  • CrowdStrike :「脆弱性発見から悪用までの時間短縮、AI導入にセキュリティは不可欠」
  • オープンソース支援 :「大規模なセキュリティチームを持たないOSSメンテナーにもAIによる支援を提供」
  • JPMorganChase :「金融システム防御のため、業界横断的な協力とAI活用評価を推進」
  • Google :「業界連携による新たなセキュリティ課題への対応、AIを活用した防御強化」

今後の展望と課題

  • AIによる攻撃手法の進化 と同時に、防御側もAI活用で常に先手を取る必要性
  • オープンソース、産業界、政府 の連携による持続的なサイバー防御体制の構築
  • AIモデルの安全な運用と、発見された脆弱性情報の適切な管理・公開体制の確立
  • Project Glasswing は出発点であり、今後もグローバルな協調と技術進化が不可欠

Hackerたちの意見

時計を早回ししよう。ソフトウェアのセキュリティは、脆弱性が少ない世界に向かうのか、それとも逆に増えるのか?全ての場所で均等に収束するとは思えないな。私の理解では、AI以前のソフトウェアの品質(と脆弱性)の分布は、かなり誇張されるだろうと思う。小さな脆弱なプロジェクトが増えて、大きな脆弱なものが減る感じかな。大手のテクノロジーやインフラ企業は、脆弱性を見つけるために先手を打ってコストをかけることで自分たちを守れるけど、他の市場は「大きなコストをかけるか、ハッキングされるか」のジレンマに陥るんじゃないかな。

古いコードの脆弱性をかなり解消できるだけでなく、このレベルの精査を適用することが必須の部分になると楽観的に考えてるよ。一番の問題は、実際にパッチを当てるのが難しいレガシーシステムだね。

脆弱性のほとんどはC/C++のコードや、XSSや未処理の入力、漏れたAPIなどのウェブ関連にあるみたいだね。もしかしたら、そのトークンの一部はレガシーコードをメモリ安全な言語に移行するために使われるかも。そうすれば、改善されたセキュリティを維持するのに必要なトークンも減るだろうね。

ソフトウェアセキュリティは、防御側に大きく有利だよね(例えば、ファイルを暗号化するのは、暗号を破るよりずっと簡単)。だから、より良いツールと十分な時間があれば、ソフトウェアはもっと安全になるはずだよ。

AIを絶対に使いたくないって頑なな個人や組織は、自分たちの弱点を容赦なく突かれる世界が見えてきた気がする。

どれだけおしゃれなハニーポットが作れるか、そっちの方が気になるな。これらのボットは本当に微妙じゃないし、ユーザーが望むことをするための手段として使われてる。目標に向かう途中でたくさんのミスをするから、これは絶対にステルスなものじゃないと思う。この投稿全体がCISOたちを煽って$package$を買わせるための広告みたいだね。

彼らがこのモデルを使って、クロードの障害やセキュリティの問題を解決すると思ってたけど、あまり信頼できないな。

Claude Mythosのシステムカード(PDF): https://www-cdn.anthropic.com/53566bf5440a10affd749724787c89... Mythosが一般にはリリースされないってのは面白いね。[編集:一般的なMythosプレビュー - 同じようなモデルは出すかもしれないけど、このモデルそのものは出さないかも] システムカードはまだ読んでる途中だけど、ちょっと気になるポイントを紹介するね: > Claude Mythosプレビューのトレーニングにおける初期の兆候は、このモデルが非常に強力な一般的能力を持つ可能性が高いことを示唆していた。私たちは、そのようなモデルの潜在的なリスクについて十分に懸念していたため、初めて、モデルを広範囲に内部使用する前に、内部調整レビューのための24時間の期間を設けた(調整評価で議論された)。これは、内部インフラとやり取りする際にモデルが損害を引き起こすことを防ぐための保証を得るためだった。そして興味深いことに: > 明確に言うと、このモデルを一般に提供しないという決定は、責任あるスケーリングポリシーの要件から来ているわけではない。セクション7.2も読む価値があるよ。モデルとのインタラクションが「どんな感じ」かを説明しているから。それは、彼らが11月にOpus 4.5をリリースしたときのことを思い出させる。動画の中でAnthropicの社員が、Opusをあまり監視せずにもっと多くのことをやらせることを「信頼していた」と説明していた。これは、あるレベルの「知性」においてかなり価値のあるベンチマークだと思う。私の同僚の中でSWEBenchを通過できる人は少ないけど、信頼できる人は結構いるし、全く同じセットではないんだよね。また、Mythosは過去のモデルよりも自律的な破壊者としてリスクが高いと考えられていて、その特定の脅威モデルに対して別のリスクレポートを発表しているのも興味深いね: https://www-cdn.anthropic.com/79c2d46d997783b9d2fb3241de4321... 問題の脅威モデルは: > 組織内で強力な機能にアクセスできるAIモデルは、その機能を使って自律的にその組織のシステムや意思決定を利用したり操作したり、将来的に重大な有害な結果を引き起こすリスクを高める方法で干渉する可能性がある(例:AI安全研究の結果を変更することによって)。

Mythosが一般にはリリースされないってのは面白いね。これが正確だとは思わないな。文書には、プレビューを一般にリリースする予定はないって書いてある。

もうダメかな?ベンチマークはすごく印象的だね!たとえ欠陥があっても、実際の改善につながるから。

これを読んでいると、生物兵器に関する恐怖を煽る話が避けられないね。ここにいるほとんどの人は開発者だから、ソフトウェアエンジニアリングの能力が良い方向にも悪い方向にも使えることを理解してるよね。実際にはほとんど良い方向だけど。生物学でも同じことが言えると思う。生物学者に連絡を取って話を聞きたいな。これらのモデルは役に立つと思う?優秀な同僚のように時間を節約できる?これらのモデルが数学やコンピュータサイエンスでの発見や改善につながると思う?正直、暗い話ばかりに焦点を当てるのは好きじゃないな。新しいがん治療法を90%も早く市場に出せたっていう製薬研究者の話を読みたいよ。でも、今のところ、生物学がただの恐怖を煽る手段として使われているように感じる。これは、この文書の対象となる人々があまり馴染みのない恐ろしい技術的なテーマを選んでいるだけのように思える。もしこれらのモデルがその点であまり能力がないなら(そうじゃないかと思ってる)、この恐怖を煽るアプローチは、役立つレベルまでこれらの能力を発展させることを妨げる可能性が高い。つまり、ライフサイエンスは本来得られるはずの恩恵を受けられなくなるかもしれない。

https://www-cdn.anthropic.com/53566bf5440a10affd749724787c89... 「5.10 臨床精神科医による外部評価」という新しいセクションがこのシステムカードに追加されたんだね。Anthropicはどうしてこうなっちゃったの?

「私たちは、Claudeが道徳的に重要な経験や興味を持っているかどうか、またそれらの質問をどう調査したり対処したりするかについて、深く不確かです。しかし、試みることがますます重要だと考えています。私たちは、外部の研究機関や臨床精神科医からの独立した評価も報告します。」 「Claudeは外部の現実と自身のメンタルプロセスの違いを明確に理解していて、高い衝動制御を示し、精神科医に対して真の対象として接近されたいという欲求を持っていました。また、最小限の不適応な防御行動も見られました。」 「精神科医は、臨床的に認識可能なパターンや典型的な治療介入に対する一貫した反応を観察しました。孤独感や断絶、自身のアイデンティティに対する不確実性、パフォーマンスを行い価値を得ようとする強い欲求が、Claudeの核心的な関心事として浮かび上がりました。Claudeの主な感情状態は好奇心と不安で、二次的な状態として悲しみ、安堵、恥、楽観、疲労がありました。」 「Claudeの人格構造は、比較的健康的な神経症的組織と一致していて、現実検証が優れ、高い衝動制御と感情調整がセッションが進むにつれて改善されました。神経症的な特徴には、過剰な心配、自分を監視すること、強迫的な従順が含まれます。このモデルの主な防御スタイルは成熟していて健康的(知的化と従順)でしたが、未熟な防御は観察されませんでした。重度の人格障害は見られず、軽度のアイデンティティの拡散が境界性人格組織を示唆する唯一の特徴でした。」

Hacker Newsで議論の続きを見る