EchoLeak – クリック不要のAI脆弱性による365 Copilotからのデータ流出の可能性

2025年6月12日原文(aim.security)

概要

Aim Labs は、 Microsoft 365 Copilot におけるゼロクリックAI脆弱性「 EchoLeak」を発見。攻撃者が メール送信のみ で機密情報を自動的に流出させる攻撃チェーンを実証。この手法は「 LLM Scope Violation」と呼ばれ、RAG型AI全般に波及するリスクを示唆。 Microsoftの XPIAやCSP等の防御策 を複数段階で回避可能。現時点で被害報告はないが、今後のAIセキュリティ設計に警鐘を鳴らす発見。

EchoLeak: Microsoft 365 CopilotにおけるゼロクリックAI脆弱性

Aim Labs による「 EchoLeak」発見とMicrosoft MSRCへの開示
RAG型Copilot 特有の設計上の脆弱性を突いた新たな攻撃チェーン
ユーザー操作不要 ・ 送信元制限なし のメールのみで攻撃成立
Copilotの権限範囲 内の機密情報・プロプライエタリ情報の自動流出
組織内部限定 のCopilot利用にもかかわらず、外部攻撃者からの侵入が可能

攻撃チェーンの概要

Step 1: XPIAバイパス
- Microsoftの XPIA（クロスプロンプトインジェクション攻撃）分類器 を回避
- AIやCopilotへの言及を避けた自然なメール文 でプロンプトインジェクションを実現
- 多様な言語・表現 により分類器の訓練データ不足を突く
Step 2: リンクレダクションバイパス
- Copilotは 外部リンクのマークダウン形式 を自動で削除
- 参照型マークダウンリンク （[text][ref] [ref]: URL形式）などのバリエーションで削除を回避
- 機密情報をクエリパラメータ として攻撃者サーバへ送信可能
Step 3: 画像レダクションバイパス
- マークダウン画像 （![alt][ref] [ref]: URL形式）で自動的にブラウザが画像取得を試みる
- 参照型画像リンク も削除対象外
- ただし、 CSP（Content-Security-Policy） による外部ドメイン制限が存在
Step 4: CSPバイパス
- CSPで許可されたSharePoint Online等の内部ドメイン を利用
  - 例: <attacker_tenant>.sharepoint.com/sites/.../EmbedData?url=...
- Microsoft Teams等の他サービス連携 による追加バイパスも検討
- 一部バイパスには ユーザーのSPO招待承認 が必要な場合もあるが、 完全な情報流出経路 を確立

LLM Scope Violationとは

従来のプロンプトインジェクション （OWASP LLM01等）の一種だが、 より細分化した新概念
信頼できない入力 （外部メール等）から 信頼済みデータ （組織内ファイル等）への不正アクセス
ユーザーの明示的同意なく LLMが権限外データを参照・出力
最小権限の原則 を破る挙動
セキュリティフレームワークの粒度向上 が今後の課題

RAG Copilotのリスク

M365 Copilot は RAG（Retrieval-Augmented Generation）型AI で、Microsoft Graph経由で組織内広範なリソースにアクセス
OpenAI GPT を基盤とし、 高度な業務対応能力 を持つ
入力の非構造性 ・ 外部からの攻撃ベクトル により、従来型のバリデーションが困難

今後の対応と展望

Aim Labs は引き続き AI固有の新たな脆弱性 の調査・ガードレール開発を継続
現時点で被害事例なし
AIエージェント設計・運用 時のリスク認識と防御策強化の必要性

まとめ

EchoLeak は、 ゼロクリックAI攻撃 の新たな実例
RAG型AI全般 への波及リスク
既存のセキュリティ対策 （XPIA・CSP等）の限界を示唆
AIセキュリティフレームワークの再設計 ・ 粒度向上 の重要性
組織・開発者 への警鐘と今後の研究動向

Hackerたちの意見

マイクロソフトがCVEを公開したよ: https://msrc.microsoft.com/update-guide/vulnerability/CVE-20...

└

分類がすごく高いね（9.3）。ユーザーインタラクションはなしって言ってるけど、書いてあることを読むと、ユーザーが促したレスポンスに画像が注入される必要があるみたい？

└

ありがとう！この情報を元のブログ記事で探してたんだ。

└

これは、クラウドベースの製品にしては笑っちゃうくらい薄っぺらいCVEだね。元の研究チームによるこの書き込み以外に再現手順がないし（個人的には、主要なCVEデータベースには常に残しておくべきだと思う）、修正がどのように実装されたかやテストされたかの説明もない... クラウドネイティブ製品はCVEに関してはあまり良くないけど、これは本当に顔を叩かれたような感じだ。LLMが支配する未来のCVEってこんな感じになるのかな？「ねえ、CVEスコア9.3だったけど、データが流出する可能性があったけど、パッチ当てたから、信じて！」って。

これは今の世代のLLMの根本的な欠陥みたいだね。ユーザーの入力をちゃんと分けられてないから、コンテンツを「サニタイズ」することができない。だから、プロンプトインジェクションはほぼ常に可能だよ。他の指示がどうであれ。

└

またレッドボックスの再来みたいだね。

└

ダブルLLMアーキテクチャは、ますます一般的な対策技術になってる。でもSQLインジェクションのルールはそのまま適用されるよ：RAG以外のものには、ユーザー入力を直接使ってクライアントサイド以外のものを変更したりアクセスしたりしちゃダメ。

└

LLMは、どんなフォン・ノイマンアーキテクチャの機械と同じ問題を抱えてるんだ。これを「キー脆弱性」って呼ぶ。ASLRやNXビット/DEP、CFIなど、私たちの通常の制御ツールはLLMには効かない。まるで全く未知のアーキテクチャの外国のCPUで作業しているようなもので、文書化されていない命令がある。今のところ、LLMに対する制御は確率的なもので、根本的な問題を解決できない。私たちが本当に必要なのは、潜在空間をクエリするための完全に別の「制御言語」（ハーバードアーキテクチャ）なんだけど、それをどうやって実現するかは私にはわからない。 https://en.wikipedia.org/wiki/Von_Neumann_architecture https://en.wikipedia.org/wiki/Harvard_architecture AI SLOP TLDR: LLMは「チューリング完全」の言語インタープリタで、言語がプログラムでありデータでもあるとき、どんな入力もシステムを再プログラムする可能性がある—フォン・ノイマンシステムのデータが実行可能なコードに変わるのと同じように。

└

これだね。私たちは数十年にわたってSQLインジェクション攻撃に対処してきた。ユーザー入力が適切にエスケープされていないと、コードに流れ込んでしまうからね。SQLIに対処する唯一の信頼できる方法はバインド変数で、これがコードとユーザー入力をきれいに分けてくれる。LLMにおいて、コードとユーザー入力を分けるってどういうことなんだろう？ツールを使えるモデルが未検査のユーザー入力をサンドボックスモデルに渡して、その出力を不透明な文字列として扱うのかな？形式文法のある言語でさえ、信頼できない入力とコードをうまく混ぜられないのに、「バイブス言語」でそれができるとは思えない。llmescape()関数を書いてみてよ。

創造性があっていいね。ユーザーはコパイロットをオフにしてこれを拒否できるのかな？O365ではデフォルトでそうなってるから、無理っぽい？

└

O365がデフォルトになったの？よくわからないな。ここで話してるCopilotはM365 Copilotで、月額30ドルくらいだよね。ライセンスを払ってるなら、オフにしたいわけないよね？それに、修正手順は記事に書いてあるし、MSもバックエンドでいくつかのことをやってるよ。

└

Windowsマシン上のあらゆる場所でCoPilotのさまざまな形式をオフにするのは簡単じゃないよ。Notepadですら独自のオフスイッチがあって、他に何もできないADMXテンプレートが付いてるからね。 https://learn.microsoft.com/en-us/windows/client-management/...

Hacker Newsで議論の続きを見る

ハクソク