世界を動かす技術を、日本語で。

ユーザーのプライバシーを守るために、NYTのデータ要求にどのように対応しているか

概要

OpenAIは ユーザーの信頼とプライバシー を最優先。The New York Timesの訴訟により データの無期限保存 が求められているが、OpenAIはこれに強く反対。 ChatGPT EnterpriseやZero Data Retention契約の顧客 は影響を受けない。データは 厳重に管理され、限定的なアクセス のみ許可。OpenAIは 透明性を維持し、今後も情報提供 を約束。

OpenAIのプライバシー保護方針と訴訟対応

  • 信頼とプライバシー を最優先とする企業方針
  • ユーザー自身でデータ管理 が可能なツール提供
  • 削除済みChatGPTチャットやAPIコンテンツ は30日以内に恒久削除
  • The New York Timesらによる 無期限データ保存要求 への反対姿勢
  • 従来のプライバシー基準や業界慣行 との矛盾を指摘
  • ユーザーの権利保護を最優先 とした法的対応

The New York Timesらの訴訟内容とOpenAIの見解

  • The New York Timesが OpenAIを提訴 し、全ユーザーデータの無期限保存を要求
  • 訴訟の根拠が 推測に基づく過度な要求 であるとの主張
  • この要求は ユーザープライバシーを危険に晒す と指摘
  • OpenAIは 裁判所命令の見直しを求めて上訴中

影響を受けるユーザーと例外

  • ChatGPT Free, Plus, Pro, Team ユーザーや API利用者 (Zero Data Retention契約除く)が対象
  • ChatGPT Enterprise、ChatGPT Edu、Zero Data Retention API利用者 は影響なし
  • Zero Data Retention契約 のビジネス顧客はプロンプトや回答の保存なし

削除データと保存義務

  • ChatGPT EnterpriseおよびEdu利用者 の削除データは保存対象外
  • 削除済みデータは 30日以内に恒久削除 (法的保存義務がない限り)

データ保存方法とアクセス管理

  • 保存データは セキュアなシステム で分離管理
  • リーガルホールド下 で法的義務以外の利用不可
  • アクセス権限は 限定された法務・セキュリティ担当者 のみ

データの第三者共有について

  • データは 自動的に第三者へ共有されない
  • 厳格な法的手続き が必要
  • 原告側が更なるアクセスを求めた場合も プライバシー保護を最優先

データ保存期間と見直し

  • 現行の裁判所命令により 無期限保存が義務付け
  • OpenAIは 命令撤回を目指し継続的に対応
  • 命令撤回後は 従来の保存方針へ復帰予定

GDPRや各国プライバシー法との整合性

  • 現時点で法令遵守のため対応中
  • The New York Timesの要求は OpenAIのプライバシー基準と相反
  • 引き続き法的手続きを進行中

モデル学習方針の変更有無

  • ビジネス顧客データはデフォルトで学習に利用しない
  • 消費者向けは設定で学習利用の可否を選択可能
  • 裁判所命令による 学習方針の変更なし

情報提供と透明性

  • 透明性維持のため、今後も情報更新を約束
  • 裁判所命令や影響内容の 重要な変更点を随時共有

データ保存ポリシーの詳細

  • ChatGPT Team :各エンドユーザーが会話保存の可否を選択可能。削除・未保存会話は30日以内に削除(法的義務除く)
  • ChatGPT Enterprise/Edu :管理者がデータ保存期間を管理。削除会話は30日以内に削除(法的義務除く)
  • API :顧客が保存期間を設定可能。30日経過後にAPI入出力を削除(法的義務除く)
  • Zero Data Retention API :入出力内容は 一切保存せずログにも残さない

Hackerたちの意見

OpenAIの法務部が、実際の会話の代わりに、ssdeepハッシュやコンテンツ定義チャンクの形でコンテンツのファジーハッシュを保存することができるかどうか気になるな。結局、NYTは情報のコーパスが非常に限られているし、APIを使って侵害コンテンツを生成している人がいるらしいから、そういうハッシュを使ってそのコンテンツが生成されたかどうかを比較できるんじゃないかな。何も保存しない方がいいけど、あの広すぎる裁判所の命令を考えると、これが一番妥当な落としどころかも。もちろん、訴訟の書類は読んでないから、NYTがもっと多くを要求しているのか、間接的な侵害を主張しているのかは分からないけど、それが私の提案を無効にするかもしれないね。

そうだね、これらの言葉を弁護士や裁判官に説明するのは難しいだろうな。

それらは本当に立派なホワイトペーパーに収まるね。でも、ふざけてる場合じゃない。すべてのChatGPTセッションは、ある三文字のスパイが毎月テープにバックアップしているS3バケットに直接送信されてる。Googleアカウントでログインした一群の素人からの、率直でタイムスタンプ付きのテキストインタラクションのデータベースだよ。メールを再発明しない限り、もっとおいしいターゲットはないよ。もちろん、バックドアがあるから、私が間違っていることを証明することすらできない。もしかしたら私だけかもしれないけど、サム・アルトマンからのピンキー・プロミスは、私のデータについての保証にはならない。マーク・ザッカーバーグがWhatsAppの安全性について歌うテレグラムと同じくらい安心できないよ。

裁判官の命令の意図を積極的に回避しようとするのは、かなりまずい考えだよ。

支持文書は見つけられなかったけど、裁判所の命令を見る限り、OpenAIは会話中に代替案を出すのに非協力的だったみたい。たとえば、裁判官がユーザーが削除を希望するデータを他のデータから分けることができるか尋ねたみたいだけど、OpenAIはそれに答えなかった。リクエストを拒否しただけでなく、単に無視した感じ。OpenAIはデータ保持のリクエストに真剣に向き合う代わりに、PR路線を選んだ可能性が高いと思う。

関連する議論: OpenAIがすべてのChatGPTログを保存する裁判所の命令を非難 - https://news.ycombinator.com/item?id=44185913 - 2025年6月(878コメント)

私のデータはどう保存され、誰がアクセスできるのですか? > 裁判所の命令に該当するコンテンツは、安全なシステムに別々に保存されています。法的保持の下で保護されているため、法的義務を果たす以外の目的でアクセスしたり使用したりすることはできません。 > 小規模で監査されたOpenAIの法務およびセキュリティチームだけが、法的義務を遵守するために必要に応じてこのデータにアクセスできるでしょう。つまり、OpenAI自身が認めているように、ユーザーのプライバシーを守るために十分かつ効果的な手段を講じているってこと?万が一このデータが漏れたら、個人的にはNYTではなくOpenAIを責めるよ。この投稿の他の表現、例えば訴訟を「根拠がない」と何度も呼ぶのは、ただの説得力のないスピン記事に見える。ここには特に見るべきものはないね。

明らかにOpenAIの視点は彼らの視点だろうね。彼らはこの訴訟を根拠がないと呼ぶだろうし、そうでなければ戦わないはずだ。

いや、削除したチャットが実際には削除されていないっていうニュースサイクルがあるから、彼らは基本的に応じなきゃいけないんだ。これは訴訟をスピンする試みじゃなくて、顧客を安心させるためのものだよ。

保存されたデータが開示の際に訴訟に関連していると判断されると、少なくとも関係する両方の当事者と裁判所に利用可能になると思う。

つまり、OpenAI自身の認めるところによれば、ユーザーのプライバシーを守るために十分かつ効果的な手段を講じているってこと?万が一このデータが漏れたら、個人的にはNYTではなくOpenAIを責めるよ。私はOpenAIのファンではないけど、これは反応する必要がある。情報セキュリティの第一原則は、すべてのシステムは侵害され得るということ。そして、データを守る唯一の方法は、それを保持しないことだ。これは「彼らはスカイダイビングに行きたくなかったけど、強制的に行かせて、空中で脳卒中で死んだから彼らのせいだ」って言ってるようなもんだ。データセキュリティについて約束する人は、せいぜい無能で、最悪の場合は不誠実だよ。

あなたがOpenAIのユーザーじゃないからかもね。私はユーザーで、便利だと思ってお金も払ってる。利用規約やプライバシーポリシーで約束された以上にデータが保持されるのは嫌だ。もし裁判官が、自分の命令がNYTのコンテンツや有料壁を気にしない何百万ものユーザーのプライバシーを脅かすことを理解していないなら、このケースを扱うのは無理だと思う。

NYTに対する奇妙な中傷だね。もしNYTに訴訟の根拠があって、裁判所がそれを承認したら、裁判所の命令を使ってNYTを中傷するのは奇妙だよ。もし根拠がないなら、「Open」AIは裁判で自分の主張を証明するチャンスがある。

彼らはこの訴訟の当事者なんだよ!根拠がないと言うのは「中傷」じゃない。彼らが言えることは、文字通りそれ以外にないからね(「根拠がない」と同義の表現、例えば「価値がない」とか以外は)。

NYTは、アメリカの法律システムの根本的な弱点を利用していると思う。つまり、関係ない当事者のプライバシーや、争いに関係のない生活の側面をほとんど考慮せずに、非常に広範囲にわたる開示法を使っているってこと。もちろん、自分たちの利益のためだけど、OpenAIの意見には賛同せざるを得ないな。

いろんな人が法律システムを色々な形で悪用してるよね。たとえその悪用が技術的に合法でも、無条件で許されるわけじゃないんだ。

NYTは都合よく振る舞ってるよね。フリーランスの記事をデータベースに入れて貸し出すことをしてた時は、著作権の強制に反対して新しい業界を支援するって言ってたし、元々の考えを変えるのは難しいって言ってたのに。今は著作権が大好きみたい。

もしNYTに根拠がないのに裁判所が承認したら、それってまだ変じゃない?

どんな会社のホステッドAPIに送信されたものも、永遠にログが残るものだと思ってた。そうじゃないと考えるのは、アプリが自分のウェブ活動を追跡してないと思うのと同じくらいナイーブだよね。

最悪の事態を想定するのは賢明だけど、何も戦わずに最悪の結果に甘んじるのは愚かだと思う。

プライバシーの無関心って、独自の決断だよね。

OpenAIが文句を言ってるのが面白いよね。お金になるなら著作権が自分たちには適用されないって言うのは平気なんだから。

つまり、このサイトでコメントしてる人たちのかなりの割合ってこと?

振り返ってみると、ベゾスがワシントン・ポストを買ったのは一番賢い選択だったね。グーグルがレディットとの契約を進めたのも良いことだった。コンテンツのリポジトリやクリエイターたちは、ライセンス契約を結ぶまで西側のLLM企業を訴え続けるだろう。もし私がOpenAIなら、集めたお金を使ってできるだけ多くのメディアを買収するために頑張るね。NYTのバックカタログって、どれくらいの価値があるんだろう?買っちゃえばいいのに、サウジアラビアに聞いてみて。

反応が物議を醸しているのは確かだけど、何らかの反応を公表してくれたのは嬉しいよ。昨日ニュースで見て、まだ彼らからの反応がないのを見て心配してたんだ。ずっと黙ってるんじゃないかって。

OpenAIがゼロデータ保持(ZDR)を申請できるようにしてくれたら、めっちゃ助かるんだけど。ビジネスのニーズにおいては、リクエストを保存したりログを取ったりする理由が全くないからね。理論上は申請できるって書いてあるけど、実際にはリクエストが無視されてるみたい。承認が必要なのは分かるし、ハードルもあるけど、ゼロデータ保持のことを言うのはマーケティング目的だけに思える。何度も申請してるけど、まだ一切の返事がないよ。フォーラムを見てると、これがすごく一般的なことみたい。

ねえOpenAI!「どうしてこうなったのか」のところで、いくつかの部分が抜けてるよ。まるで彼らが理由もなく君たちに怒ってるみたいに聞こえるけど、それっておかしくない?こんな立派な人たちに対してさ!

消費者のお客様:あなたは、チャットがChatGPTの改善に使われるかどうかを設定でコントロールできますし、この命令もそれを変えるものではありません。 「設定」の中で?これは「全員のためにモデルを改善する」というトグルを提供するダークパターンのことを指してるの?実際には何も変わらないのに。ユーザーは、見つけにくいオフアプリのポータルで手動でリクエストを提出しなきゃいけないけど、このダークパターンが彼らを騙して、探す必要がないと思わせてるんだ。

もう少し詳しく説明してくれない?

そうだね、「全員のためにモデルを改善する」をオフにしても何も起こらない理由を説明して、言及してるオフポータルアプリへのリンクも教えてくれない?