ハクソク

世界を動かす技術を、日本語で。

OpenAIがAI画像の検証ツールとしてGoogleの「SynthID」ウォーターマークを採用

2026年5月20日原文(openai.com)

概要

OpenAIは、画像や音声の生成・編集ツールの信頼性向上に取り組み。 C2PA準拠やGoogle SynthIDによる多層的な証跡管理を強化。公開検証ツールのプレビューで、AI生成画像の識別を容易化。業界標準との連携による透明性と信頼性の向上。今後は他プラットフォームや多様なコンテンツへの対応も予定。

OpenAIによるコンテンツ証跡強化の取り組み

OpenAI のツールが日常的に画像・音声の生成や編集に活用される現状
より 表現力豊か で有用、かつアクセスしやすいコミュニケーションの実現
メディアの 出所や生成過程の可視化 による信頼性の向上
証跡（provenance）シグナル によるコンテンツの背景情報提供
オンライン上の信頼構築を目指す 多層的かつエコシステム駆動型モデル の導入

C2PA準拠による信頼エコシステムの構築

2024年 からDALL·E 3、ImageGen、Soraで Content Credentials を導入
Coalition for Content Provenance and Authenticity（C2PA） 運営委員会への参加
C2PA はメタデータと暗号署名により、メディア情報の安全な伝達を実現
ジャーナリストやプラットフォーム、一般利用者への コンテキスト提供
C2PA準拠製品 となることで、証跡情報の保存・伝達が可能に

Google SynthIDによる多層的証跡と耐久性向上

C2PAメタデータ で生成・編集・署名者情報を付与
メタデータは 変換やアップロード時に消失するリスク
Google DeepMind SynthID による不可視ウォーターマーク技術の導入
- ChatGPT、Codex、OpenAI APIで生成した画像に適用
ウォーターマーク はファイル変換やスクリーンショットにも耐性
C2PAメタデータ と SynthIDウォーターマーク の相互補完

公開検証ツールのプレビュー提供

メタデータやウォーターマークの 検出ツール を一般公開予定
ChatGPT、OpenAI API、Codexで生成された画像の 証跡シグナル検証
Content Credentials や SynthID を統合的に判定
2024年の画像検出分類器の研究結果を活用
検出失敗時は慎重な対応 ：証跡が消失した場合、AI生成か断定せず
初期はOpenAI生成コンテンツのみ対応、将来的に 他社プラットフォームや多様なコンテンツ への拡張を予定

今後の展望とOpenAIの姿勢

単一技術では不十分、標準規格・耐久性のあるウォーターマーク・公開検証の三位一体が重要
Content Credentials や C2PA準拠、 SynthID採用、 公開検証ツール によるエコシステムへの貢献
長期的に 相互運用性の高い証跡エコシステム の実現を目指す

Hackerたちの意見

こういうウォーターマークって、簡単に消せたり歪めたりできない？人々があまり頼らない限りは役に立つけど、回避するために努力する価値はなさそう。もしSNSがこういうウォーターマークのある画像を禁止し始めたら、一晩で消えちゃうんじゃないかな。

└

本物のSynthIDウォーターマークをNano Banana 2/NBProの出力から実際に消すGitHubリポジトリは、まだないと思う。ほとんどは、これを達成してない研究プロジェクトばかり。今まで見た方法は、透明度を使ったり、元の画像を重ねたりする変なトリックとか、低ノイズレベルでNB生成画像を再生成するための拡散モデルを使う方法だけど、これも元の画像を変えちゃうんだよね。

└

いや、簡単にできる修正にはかなり強い抵抗があるよ。とはいえ、不可能だとは思わないけど。

└

これ、数年前にリリースされたもので、まだ壊れてないみたい。いつかは壊れるだろうけど、ディープフェイクを作ってからFacebookに投稿するまでに1年か2年待たなきゃいけないなら、それでも十分かも。1ヶ月でも足りるかもしれないね。

└

簡単に定義すると、画像のスペクトル分析に基づいてうまくいくアプローチがあるみたいだね。 https://github.com/aloshdenny/reverse-SynthID

└

AIが非常に詳細な説明に基づいて画像をゼロから再作成する技術がうまくいくかもしれないと思ってる。

いいね。削除されるって言われてるけど、再現可能なリポジトリは見たことないな。

└

ステーブルディフュージョンで10%〜15%のノイズ除去強度。これで完了。Nano Banana Proがリリースされた初日にテストして、うまくいったよ。今でもNano Banana 2に対しても機能してる。これをどこにも投稿しなかったのは、（傲慢に）公に言うとネットが悪化すると思ったから。でも、それは純粋な傲慢だったね。初日にこれを思いついたなら、もちろん他の何百万ものプログラマーもやってるよね。とはいえ、SDモデルからの典型的なアーティファクトが出るから、他の方法（あるいはズームインしてよく見るだけでも）で検出されるかもしれない。

└

それはできるけど、多くの人は気づかないと思う。SynthIDで検出できる偽情報も見たことあるし。

└

最初から別のモデルを使った方がずっと楽だと思う。

アップロードせずにこれをやる方法はないの？

└

現在はないね。OpenAIは「公開検証ツール」を約束してるけど、実際に見ないと信じられないな。

Hacker Newsで議論の続きを見る