概要
- 米国の多くの地方ニュースサイトが Internet Archive のアーカイブボットを制限
- 背景には AI企業による無断データ利用への懸念 が存在
- 主要出版社や独立系メディアも robots.txtによるブロック を強化
- 研究者・ジャーナリスト・市民の 情報アクセスへの影響 が拡大
- 著作権保護と アーカイブの公共性の対立 が今後の課題
米国大手ニュース出版社によるInternet Archiveの制限強化
-
McClatchy, Advance Local, Tribune Publishing などの大手新聞チェーンが Internet Archiveのアーカイブボット を制限
-
2024年1月 にNieman Labが主要ニュース出版社によるブロック措置を報道
-
The New York Times, The Guardian, USA Today Co. などが対象
-
直接AI企業によるWayback Machineからの無断スクレイピングの証拠は未確認
-
しかし、過去5ヶ月で ブロックするニュースサイト数が増加 し、特に地方メディアで顕著
- 340以上の米国地方ニュースサイト がInternet Archiveへのアクセス制限
- 大手地方メディア5社(USA Today Co., McClatchy, Advance Local, MediaNews Group, Tribune Publishing)が多くを占める
-
Alden Global Capital 傘下のMediaNews GroupやTribune Publishingも積極的に制限
-
研究者・歴史家・市民の ウェブアーカイブ利用 への影響
ジャーナリスト・研究者への影響と懸念
- Wayback Machineの地方ニュースアーカイブは 現役ジャーナリストの必須ツール
- オンライン署名活動で アーカイブ維持の要望 が高まる
- 地方ニュースのアーカイブが失われると 過去記事の調査や検証が困難 になるリスク
技術的対応・出版社の立場
- Internet Archive側は 悪用防止策(ダウンロード制限・Bot監視) を強化
- 利用規約で 学術・研究目的のみ許可 と明記
- 出版社側は 知的財産保護 と AI企業への交渉力維持 を重視
- Condé NastやThe Atlanticなども Cloudflare等を活用したブロック を推進
AI企業の影響と著作権問題
- AI企業による 無断学習データ利用 が出版社の警戒を招く
- OpenAIやMicrosoftなどを相手取った 著作権訴訟 も進行中
- 独立系メディアも 正しい引用やリンク付与の担保 を重視
- Folha de S.Paulo(ブラジル最大手紙)など 国際的にもブロック拡大
アーカイブの公共性と今後の課題
- アーカイブ維持には 高額な技術インフラ・専門知識・コスト が必要
- デジタル時代以前は新聞社が 物理的アーカイブ を自前で管理
- 現在は 外部アーカイブサービスの公共性 と 出版社の権利保護 が衝突
- 今後は 適切なライセンス契約・引用ルールの整備 が重要課題
- 市民・研究者・メディア関係者による 議論と合意形成の必要性
まとめ
- 米国を中心に ニュースアーカイブの公開制限が急速に広がる現状
- AI技術の発展 が著作権・公共性・情報アクセスの新たな摩擦点に
- アーカイブの価値と知的財産保護 のバランスをいかにとるかが問われる時代