世界を動かす技術を、日本語で。

OpenAIがAI画像の検証ツールとしてGoogleの「SynthID」ウォーターマークを採用

概要

OpenAIは、画像や音声の生成・編集ツールの信頼性向上に取り組み。 C2PA準拠やGoogle SynthIDによる多層的な証跡管理を強化。 公開検証ツールのプレビューで、AI生成画像の識別を容易化。 業界標準との連携による透明性と信頼性の向上。 今後は他プラットフォームや多様なコンテンツへの対応も予定。

OpenAIによるコンテンツ証跡強化の取り組み

  • OpenAI のツールが日常的に画像・音声の生成や編集に活用される現状
  • より 表現力豊か で有用、かつアクセスしやすいコミュニケーションの実現
  • メディアの 出所や生成過程の可視化 による信頼性の向上
  • 証跡(provenance)シグナル によるコンテンツの背景情報提供
  • オンライン上の信頼構築を目指す 多層的かつエコシステム駆動型モデル の導入

C2PA準拠による信頼エコシステムの構築

  • 2024年 からDALL·E 3、ImageGen、Soraで Content Credentials を導入
  • Coalition for Content Provenance and Authenticity(C2PA) 運営委員会への参加
  • C2PA はメタデータと暗号署名により、メディア情報の安全な伝達を実現
  • ジャーナリストやプラットフォーム、一般利用者への コンテキスト提供
  • C2PA準拠製品 となることで、証跡情報の保存・伝達が可能に

Google SynthIDによる多層的証跡と耐久性向上

  • C2PAメタデータ で生成・編集・署名者情報を付与
  • メタデータは 変換やアップロード時に消失するリスク
  • Google DeepMind SynthID による不可視ウォーターマーク技術の導入
    • ChatGPT、Codex、OpenAI APIで生成した画像に適用
  • ウォーターマーク はファイル変換やスクリーンショットにも耐性
  • C2PAメタデータSynthIDウォーターマーク の相互補完

公開検証ツールのプレビュー提供

  • メタデータやウォーターマークの 検出ツール を一般公開予定
  • ChatGPT、OpenAI API、Codexで生成された画像の 証跡シグナル検証
  • Content CredentialsSynthID を統合的に判定
  • 2024年の画像検出分類器の研究結果を活用
  • 検出失敗時は慎重な対応 :証跡が消失した場合、AI生成か断定せず
  • 初期はOpenAI生成コンテンツのみ対応、将来的に 他社プラットフォームや多様なコンテンツ への拡張を予定

今後の展望とOpenAIの姿勢

  • 単一技術では不十分、標準規格・耐久性のあるウォーターマーク・公開検証の三位一体が重要
  • Content CredentialsC2PA準拠SynthID採用公開検証ツール によるエコシステムへの貢献
  • 長期的に 相互運用性の高い証跡エコシステム の実現を目指す

Hackerたちの意見

こういうウォーターマークって、簡単に消せたり歪めたりできない?人々があまり頼らない限りは役に立つけど、回避するために努力する価値はなさそう。もしSNSがこういうウォーターマークのある画像を禁止し始めたら、一晩で消えちゃうんじゃないかな。

本物のSynthIDウォーターマークをNano Banana 2/NBProの出力から実際に消すGitHubリポジトリは、まだないと思う。ほとんどは、これを達成してない研究プロジェクトばかり。今まで見た方法は、透明度を使ったり、元の画像を重ねたりする変なトリックとか、低ノイズレベルでNB生成画像を再生成するための拡散モデルを使う方法だけど、これも元の画像を変えちゃうんだよね。

いや、簡単にできる修正にはかなり強い抵抗があるよ。とはいえ、不可能だとは思わないけど。

これ、数年前にリリースされたもので、まだ壊れてないみたい。いつかは壊れるだろうけど、ディープフェイクを作ってからFacebookに投稿するまでに1年か2年待たなきゃいけないなら、それでも十分かも。1ヶ月でも足りるかもしれないね。

簡単に定義すると、画像のスペクトル分析に基づいてうまくいくアプローチがあるみたいだね。 https://github.com/aloshdenny/reverse-SynthID

AIが非常に詳細な説明に基づいて画像をゼロから再作成する技術がうまくいくかもしれないと思ってる。

いいね。削除されるって言われてるけど、再現可能なリポジトリは見たことないな。

ステーブルディフュージョンで10%〜15%のノイズ除去強度。これで完了。Nano Banana Proがリリースされた初日にテストして、うまくいったよ。今でもNano Banana 2に対しても機能してる。これをどこにも投稿しなかったのは、(傲慢に)公に言うとネットが悪化すると思ったから。でも、それは純粋な傲慢だったね。初日にこれを思いついたなら、もちろん他の何百万ものプログラマーもやってるよね。とはいえ、SDモデルからの典型的なアーティファクトが出るから、他の方法(あるいはズームインしてよく見るだけでも)で検出されるかもしれない。

それはできるけど、多くの人は気づかないと思う。SynthIDで検出できる偽情報も見たことあるし。

最初から別のモデルを使った方がずっと楽だと思う。

アップロードせずにこれをやる方法はないの?

現在はないね。OpenAIは「公開検証ツール」を約束してるけど、実際に見ないと信じられないな。

画像内のC2PAやIPTCメタデータを検出するためのデバイス上アプリを作ったことがあるんだ。他にも色々やってるけど、SynthID検出のサポートも逆エンジニアリングができたら追加できるかもしれない。

メタデータやSynthIDにはどんな情報が含まれてるの?SynthIDにどれくらいのビットをエンコードできるの?合成コンテンツの栄養表示みたいなものを作るのに使えるのかな?例えば、10%が合成テキストで、30%が合成画像とか。今日のあなたの現実は15%が合成だったよ(75%がメガコープ、25%がオープンウェイトネオクラウド)。

2025年10月のSynthID-Image論文は、エンコーダー・デコーダーのもので、512x512の画像でフラグや136ビットのペイロードをチェックするテストをして、さまざまな変換後の透かしの強度を確認したらしいね。おそらく、実際に使われているバージョンは意味のある違いがあるんだろうね。[0]:https://arxiv.org/html/2510.09263v1

それは無理だと思うな。合成した部分を他のオーガニックな画像に貼り付けても、SynthIDはそれを認識できないだろうし。

もしかしたら、ユーザーIDや個人の指紋かもしれないね。昔からプリンターにそれを追加してたし、これを使えば生成するすべての写真や画像にも簡単に適用できるよ。

これらは素晴らしいけど、悪意のある人たちがSynthIDを使わないシステムを作るっていう問題があるんじゃない?

現時点ではかなり助かってるよ。多くの人が怠けてて、SynthIDにすぐに引っかかってる。画像生成が安くなれば、最終的には関係なくなるだろうけど、今は自己ホスティングしてる人は少ないし、補助金なしの価格を払う気がある人も少ないから、大多数はGemini、OpenAI、Midjourneyを使ってる。もしこの3つがSynthIDを採用したら、他のものを使う人はほんの一部だけになるだろうね。

これはただのパフォーマンス的なナンセンスだね。いろんなメディアで物を作る人間としては、自分が選んでない恣意的なメタデータを追加するこのツールは絶対に避けるよ。こんな変なDRMのグロープが入ったテクスチャでゲームを作るべきなの?フォトショップってどれくらい古いのに、なんで免除されてるの?

完璧じゃないからって、役に立たないわけじゃないよね。ネットで見た投稿の中には、誰かが画像をGoogleでSynthIDチェックにかけて、偽造だって証明されたものもあったし。 > フォトショップはどれくらい古いの?なんで免除されてるの?まず、GoogleやOpenAIが開発したわけじゃないからね。フォトショップでリアルだけど誤解を招く画像を作るのは、AIよりもずっとハードルが高いし、従来の画像編集を使った場合の検出技術もすでにあるからね。

フォトショップはどれくらい古いの?なんで免除されてるの?今日の最大理論的な偽情報出力は、2021年のフォトショップと比べてどうなの?

フォトショップはどれくらい古いの?なんで免除されてるの?ジェネAIとフォトショップの違いを考えられるでしょ?君ならできると思うよ。

厳密に言うと、DRMはデジタル著作権管理のことで、知的財産に関係してるよね。SynthIDは、GoogleやOpenAIが自分たちの画像に対してIP権を主張している場合にのみDRMになるんだ。法律的にそれが合法かどうかもわからないけど。

一応記録として: https://en.wikipedia.org/wiki/Printer_tracking_dots

あなた: 「パフォーマンス的なナンセンス!自分が選んでない恣意的なメタデータ!」 でもあなた: ゲームは何らかの形で流通するから、たくさんのテレメトリーやメタデータがあるよね。App Storeの認証や、Steam、Itchなどは分析を集めて、あなたのことをよく知ってるし、もし自宅でエクレクティックなWebGLゲームをホストしてたら、ISPも知ってるよ。iPhoneやAndroidでハッカーニュースに投稿する時、あなたのメールアドレスがあるし、携帯ネットワークはIPv6のグローバルユニークアドレスを持ってる… 「でも自分が選んだことだ!」って言うんだろうね。 「私を200%間違わせるようなことは無効だ」って言うのは、すごくパフォーマティブだと思うよ。正直言って、こういうノリの反応が本当に嫌い。コンテンツの帰属について(メモをチェック)反応するのがね。この考え方だと、すべての非難が告白になっちゃうよ。どうしてそれが見えないの?

もし彼らが印刷してスキャンしたり、スマホで写真を撮ったりするような高度な回避技術を使ったらどうなるの?

SynthIDはこういうことには結構強いけど、完璧ではないよ。

まずはその画像がOpenAIから来たかどうかを確認して、次にサブスクライバーのデータや位置情報を含めるんだって。結局、誰もAIが生成した画像やテキストを見たくないってことに気づくんじゃないかな。それが分かったら、このツールは一般には失敗して、政府専用になるだろうね。

写真のようにリアルなAI生成の唯一の使い道は、どうやら騙しのようだね。アメリカでは、すでにAI生成の動画が政治広告に使われてるのを見かけるよ。

黒い背景でAI画像を生成するように指示すると、いいモニターで見ると合成痕が見えるんだ。繰り返しのぼやけたパターンで、特に何もない。2ピクセルごとにマスクをかけて、欠けたピクセルを再生成して、さらに1ピクセルずらして2ピクセルごとにマスクをかけることで、うまく消せたよ。市販のモデルを使ってピクセルを埋めたけど、最初に深度マップをエクスポートして、ノイズを除去してからマスクしたピクセルが元の内容に合うようにしたんだ。結果は100%完璧ではなかったけど、もっと時間をかけてこの特定の用途に調整したモデルを使えば、AIの透かしを問題なく消せると思う。

なんで?

0.5ビットの透かし(存在/不在)を取り除ける自信はないな。見えてるのは多分、機能的なダミーだと思う。

でも、もっと時間をかけてこの特定の用途に調整したモデルを使えば、AIの透かしを問題なく消せると思う。AIが自分自身に対して使われるのを見るのはいつも面白いね。

現在、この記事がちょうど隣にあるよ: https://news.ycombinator.com/item?id=48200569