世界を動かす技術を、日本語で。

NYT、アトランティック、USAトゥデイに「Wayback Machine」を維持するよう伝えてください

概要

  • ジャーナリズムの自由は記事の保存と継承の自由でもある主張
  • 主要メディアがInternet Archiveとの協力を停止した現状の問題提起
  • Wayback Machineの役割と信頼性の強調
  • AIを理由としたアーカイブ禁止への反論
  • メディアリーダーへの協力要請

主要メディアへの公開書簡:Internet Archiveと報道の保存を求めて

  • ジャーナリストの自由とは、 記事を書く自由 だけでなく、 作品が後世に読まれ記憶される自由 でもある主張

  • 2026年、 World Press Freedom Day を迎えるにあたり、 New York Times, The Atlantic, USA Today など主要メディアの記事が、 非営利団体Internet Archive によって保存されていない状況

  • 主要メディアおよび全ニュースメディアに対し、 Internet Archiveと協力しWayback Machineにニュースを保存する ことを公開で約束するよう要請

    • 今年2月以降、 New York Times はInternet Archiveに対し Wayback Machineによる保存停止 を要求
    • USA Today はWayback Machineを活用した調査報道を行う一方で、自社記事の保存をブロックする矛盾
    • 100名超のジャーナリストがInternet Archiveの活動を称賛する書簡を提出し話題となったが、 The Atlantic のCEOは解決策へのコミットを示さず
  • 主要メディアがWayback Machineを禁止する理由として挙げる AIへの懸念は仮定的で根拠薄弱

  • ジャーナリストと、その活動を支える 公共性の高い非営利団体 であるInternet Archiveは、より良い扱いを受けるべきという主張

    • 他のウェブサイトが「archive」を名乗っても、 Wayback Machine は長年にわたり信頼性を保ち続けている点を強調
    • Wayback Machineは ペイウォールを回避するサービスではなく、長期的な報道の保存を目的
  • AIを口実に報道を隠すのは本末転倒であり、むしろ AI時代こそWayback Machineの重要性が増す

  • AI企業は規則を無視してニュースを収集できる現状で、 Internet Archiveだけが誠実さ(integrity)で差別化

  • 検閲や権威主義の台頭、報道への圧力や事実の抹消リスク が高まる中、Wayback Machineの中立的な保存活動の重要性を強調

    • 多くのジャーナリストが脅迫や命の危険にさらされている現状への敬意として、 Wayback Machineの強化 を訴え
    • 報道は同僚や遺族だけでなく 歴史の証人としてアクセス可能であるべき
  • Wayback Machineの存在は、 権力者にとって不都合な報道の削除圧力 からメディアを守る防波堤

  • 真のジャーナリズムを続けるメディアこそ、 Wayback Machineのような同盟者を支持する利益 があると主張

  • 独立したニュース保存の仕組み を確立することは、本来これほど困難であるべきではないという問題提起

  • 主要メディアのリーダーに対し、 Internet Archiveとの協力と全ニュースのWayback Machine保存へのコミットメント を強く要請

    • 署名者一同

Hackerたちの意見

たぶん、Financial Timesみたいに、NewsBankサービスで30日間のエスクローを設けるべきだね。

TimesとAtlanticの間のこの議論について少し知ってるよ。これ言ったら叩かれるかもしれないけど、前者の上の人にHNでよく見かけるペイウォールの回避策についてどう思うか聞いてみたんだ。そしたら、まさかの知らないって言われてびっくりしたよ。結局、30日後にそういう情報を公開するのがいいんじゃないかってことで意見が一致した。アクセス制限(将来的に関連するかもしれないから、1日にN回以上は引っ張れないとか)も考慮してね。私の知る限り、Internet Archiveはこの問題について何もアプローチしてないみたい。出版物に圧力をかけるだけじゃなくて、交渉も促した方がいいと思う。

未来に関連性が出てくる場合に備えて、1日にN回以上は引っ張れないように。 「関連性が出てくる」って、どっちにしてもあなたにとってメリットになるんじゃない? どこかに不幸なデジタル統計のダッシュボードがあって、これらの数字がジャーナリズムの根本的な精神に取って代わってるのかもって考えちゃうよね。

驚かないよ。彼らは間違ったモデルで、間違った時代に、間違ったインセンティブで動いてる。データや情報が不足している世界にいるかのように振る舞ってるけど、今は逆転してる。真実の唯一の源はなくて、データや情報は豊富にある。もちろん、その豊富さには偽データや嘘も含まれてるけど、それでも豊富さはある。ニューヨークタイムズやアトランティックが最高の日にやってる仕事、つまり調査報道チームはこの世界に貢献してるけど、彼らはその仕事を隠したり閉じ込めたりしようとしてる。ジャーナリスト自身はそれをアクセス可能にしたいと思ってるのにね。理想的な世界では、すべての子供がNYTやアトランティックを通じて英語を学び、これらの記録の源で育ち、そこから学び、世界を見ていくことになる。でも、今のモデルではそれができない。パトロネージとウィキメディアスタイルの財団が混ざった方がいいと思う。制度やそのミッションを愛する読者が、好きなだけお金を払って、スケーリングの特典を受けられるようにする(例えば、NYTが大好きで月に1万ドル寄付したいなら、それに見合ったアクセスや質問ができる権利を得るべき)。で、その寄付金は基金に流れ込んで、投資され、その成果が運営予算の一部として分配される。情報が豊富な世界で古典的なジャーナリズムが生き残るには、パトロネージベースのアプローチが必要だと思う。

HNでよく見かけるペイウォールの回避策についてなんだけど、彼らが知らなかったって聞いて本当に驚いたよ。インターネットアーカイブはペイウォールの回避策としてよく使われてるの?一般的にはarchive.isが使われてるけど、IAとは関係ないよね。

これが起こったのは、archive.orgがrobots.txtを尊重して、これらのサイトがクローラーをブロックしているからで合ってる?正直、どう表現すればいいかわからないけど、正しいこと(つまりrobots.txtを尊重すること)をした結果、請願に対する反応を求められるのは残念だよね。一方で、他の人たちはその指示を無視して利益を得てるわけだし。

正解。nytimes.comのrobots.txtからの例: User-agent: archive.org_bot Disallow: /

あなたの考えに役立つかはわからないけど、もしarchive.orgみたいな有名なクローラーがrobots.txtを無視したら、訴訟(または他の形の圧力)に直面する可能性が高いよ。これは単に道徳的な選択じゃなくて、唯一の賢い選択なんだ。「他の人たちが利益を得る」理由は、ピンキースワインスタイルの義務が、訴訟を起こすほど小さかったり影が薄かったりするプレイヤーには影響しないからだよ。

彼らはAI企業がコンテンツを盗むのを制限したいからなんだけど、インターネットアーカイブが全部プロキシしてしまうとできないんだよね。最新のニュースをスクレイピングしなかったら、LLMはすごく使えなくなるだろうし。

いや、archive.orgはrobots.txtを尊重しないよ。直接連絡して、あなたのサイトを含めないようにお願いする必要がある: https://blog.archive.org/2017/04/17/robots-txt-meant-for-sea...

DRMが生み出したのと同じバカげた話だね。海賊になろう、だって海賊は自由だから…

これ楽しみだな(https://news.ycombinator.com/item?id=48070516)

広告を見たこともないし、あの組織にサブスクリプションを払ったこともない人たちが、バックドアを開けておけって要求するの?

アイデア: スクレイピングを許可するけど、1年間は公開できないってのはどう?

サインしたけど、正直に言うと。ウェイバックマシンを使って昔のNYTの記事を読む回数と、高評価のHNコメントからリンクされた比較的新しい記事を読むために訪れた回数を示す円グラフは、しっかりした円になりそう。

アーカイブされたコピーがなかったら、NYTの記事を見るためにお金を払ったと思う? 疑わしいね。

暗号的に検証可能なインターネットアーカイブが必要だね。Web 3やnostr、gpg pgpみたいなものがないと多分無理だと思う。よくわからんけど。

よくわからん。うん。

そういえば、MetaやXとかはどうなるの?