概要
Anthropic社はAIモデルClaudeの開発のため、多額を投じて中古書籍を購入・スキャン。 一方、700万冊以上の海賊版書籍もダウンロードし訓練データに利用。 裁判所は購入書籍のデジタル化はフェアユースと認定。 海賊版利用はフェアユースに該当しないと判示。 本判決はAI訓練における著作権の新たな指針となる可能性。
Anthropicによる書籍の購入・スキャンとAI訓練
- Anthropic社 はAIチャットボット Claude の訓練目的で、中古書籍を 数百万ドル規模で大量購入
- 書籍は 製本を外し、ページを裁断・スキャン し、デジタルファイル化
- デジタル化後、 オリジナル書籍は廃棄 し、データは社内の「リサーチライブラリ」に保存
- AIモデル開発には 膨大なテキストデータ が必要で、SNS投稿や動画、書籍など多様なソースを活用
- 著者や出版社などからは「 無断利用は著作権侵害」との反発
海賊版書籍のダウンロードと利用
- Anthropic社 は正規購入だけでなく、 700万冊超の海賊版書籍もダウンロード
- 2021年、共同創業者Ben Mannは Library Genesisから500万冊以上 ダウンロード
- 翌年には Pirate Library Mirrorから200万冊以上 ダウンロード
- これらの行為は 明確に海賊版と認識した上で実行
- CEO Dario Amodeiは「 法的・実務的な手間を回避するため」と説明
裁判所の判断とフェアユース
- カリフォルニア北部地区連邦地裁の William Alsup判事 が訓練データの調達手法を詳細に分析
- 正規購入書籍のデジタル化・利用は「極めて変容的」でフェアユースに該当
- 「 新たなコピーや作品を作らず、検索性・省スペース化のための変換」と認定
- 海賊版書籍の利用はフェアユースに該当しない と明確に否定
- 「 恒久的な汎用ライブラリ構築は正当化されない」と判示
業界への影響と今後の展望
- 本判決は AIモデル訓練における著作権のフェアユース適用に関する初の事例
- AI企業側は「 創造性・科学の進歩のため」と正当性を主張
- クリエイター側は「 無断利用は権利侵害」と訴訟を相次いで提起
- 例:DisneyがMidjourneyを著作権侵害で提訴
- 今後も AIと著作権の法的整理・議論の進展 が予想される
参考:関連訴訟・動向
- Anthropic社 に対する著者集団の集団訴訟
- OpenAI や Midjourney など、他AI企業への訴訟も多発
- 「Star Wars」「The Simpsons」など有名キャラクターの無断利用も問題視