アンソロピックは何百万冊もの古本を切り刻み、700万冊の海賊版をダウンロードした - 裁判官

2025年7月7日原文(businessinsider.com)

概要

Anthropic社はAIモデルClaudeの開発のため、多額を投じて中古書籍を購入・スキャン。一方、700万冊以上の海賊版書籍もダウンロードし訓練データに利用。裁判所は購入書籍のデジタル化はフェアユースと認定。海賊版利用はフェアユースに該当しないと判示。本判決はAI訓練における著作権の新たな指針となる可能性。

Anthropicによる書籍の購入・スキャンとAI訓練

Anthropic社 はAIチャットボット Claude の訓練目的で、中古書籍を 数百万ドル規模で大量購入
書籍は 製本を外し、ページを裁断・スキャン し、デジタルファイル化
デジタル化後、 オリジナル書籍は廃棄 し、データは社内の「リサーチライブラリ」に保存
AIモデル開発には 膨大なテキストデータ が必要で、SNS投稿や動画、書籍など多様なソースを活用
著者や出版社などからは「 無断利用は著作権侵害」との反発

海賊版書籍のダウンロードと利用

Anthropic社 は正規購入だけでなく、 700万冊超の海賊版書籍もダウンロード
2021年、共同創業者Ben Mannは Library Genesisから500万冊以上 ダウンロード
翌年には Pirate Library Mirrorから200万冊以上 ダウンロード
これらの行為は 明確に海賊版と認識した上で実行
CEO Dario Amodeiは「 法的・実務的な手間を回避するため」と説明

裁判所の判断とフェアユース

カリフォルニア北部地区連邦地裁の William Alsup判事 が訓練データの調達手法を詳細に分析
正規購入書籍のデジタル化・利用は「極めて変容的」でフェアユースに該当
- 「 新たなコピーや作品を作らず、検索性・省スペース化のための変換」と認定
海賊版書籍の利用はフェアユースに該当しない と明確に否定
- 「 恒久的な汎用ライブラリ構築は正当化されない」と判示

業界への影響と今後の展望

本判決は AIモデル訓練における著作権のフェアユース適用に関する初の事例
AI企業側は「 創造性・科学の進歩のため」と正当性を主張
クリエイター側は「 無断利用は権利侵害」と訴訟を相次いで提起
- 例：DisneyがMidjourneyを著作権侵害で提訴
今後も AIと著作権の法的整理・議論の進展 が予想される

参考：関連訴訟・動向

Anthropic社 に対する著者集団の集団訴訟
OpenAI や Midjourney など、他AI企業への訴訟も多発
- 「Star Wars」「The Simpsons」など有名キャラクターの無断利用も問題視

Hackerたちの意見

これがAIの未来を形作る人たちなの？彼らがよく語る倫理的価値観はどこに行ったの？中国には何十年も前から偽造品の責任を追及してきたし、輸出も規制してる。なのに、Anthropicが同じ違法行為をした後に、自社の製品やサービスを輸出するのはどうして許されるの？

└

これが目の前で見えるカースト制度の実態だよ :D

└

物を壊して、早く動け。

└

あなたにはこのルール、私にはあのルール… 社会全体にヒポクリシーな行動があふれてるのに気づかないの？ * お酒飲んで運転したら、大きな罰金とたくさんのトラブル。 * お酒飲んで運転してるのが上院議員、警官、市長だったら… まあ、見て見ぬふりしようか。 * あなたが怒りのコントロールができなくて誰かを地面に叩きつけたら、刑務所行き。 * 警官が怒りのコントロールができなくて誰かを地面に叩きつけたら、調査中は有給休暇、もしかしたら戒告。資格免責だね！ * 10,000ドルの税金詐欺で前科あり、刑務所行きかも。 * 企業の役員が1億ドルの税金詐欺をしたら、10年後に弁護士と戦って、もしかしたら何かあるかも、ああ、5百万ドルの罰金が出るかもね。ごめんけど、法律の下でみんなが平等っていうのはずっと幻想だったよ。私たちは中国に対して偽造品の責任を問うてるけど、それは私たちの企業や収入に影響があるから。でも「私たち対私たち」になると、ちょっとややこしくなって、一般的にバックが一番強い人（お金、経済的価値、弁護士）が勝つ傾向がある。待って、誰かが私の本を盗んだら、その人を訴えて賠償金をもらえるけど（弁護士代はもっとかかるけど、それは問題じゃない）。もしAI企業が私の本を盗んだら、勝つ確率は1%に近い、なぜならたくさんの高給取りの弁護士がいるから、勝つのが難しくなる。私たちの社会は常に力、富、影響力に基づいている。持っているほど、他の人が罰金や刑務所に行くようなことから逃げやすくなる。

└

「私たちは数十年にわたり、中国に対して偽造品の責任を問うてきたし、彼らの輸出を規制してきた」本当に？私たちは別の多元宇宙から来たの？私が今まで住んできたところでは、中国の偽造品に対して、輸入時に時々偽造品を押収する以外、何もしていないよ。それは単に地元の偽造品法を時々施行しているだけで、製造している団体を罰することとは程遠い。実際、企業はすべてを中国に外注し始めて、さらなる知的財産の盗難や準コピーをさらに簡単にしている。

└

じゃあ、アンソロピックが同じ違法行為をしておいて、なんで製品やサービスを輸出できるの？金儲けしてる企業にはルールが適用されないってことか。そんなもんだよね。

└

不正な奴らは本を一冊も買ってないからね。

└

シリコンバレーはずっと倫理の反対側にいるよね。そこの基盤はもっと右寄りでリバタリアン的で、極端な感じ。

└

なんで彼らがこれらの本の情報を使うのが不倫理なの？明らかに本を再販してるわけじゃないし、情報自体は著作権で保護されることはないよ。引用を含む資料を出版して売ることもできるしね。

海賊版を作って罰金を払う方が、個別に本を全部買うよりずっと安上がりだと思うよ。これが正当化されるとは言わないけど、もし君がその立場だったらどうする？「彼らにはお金がある」っていうのは論点じゃない。何百万ページも個別に買って、スキャンして、処理するのにどれだけの労力がかかるかってことだよ。それをやってもらえるなら、わざわざやり直す必要はないじゃん。

└

故意の侵害には1作品あたり最大150Kの罰金がある（これがそうだよね）。105B以上は、Anthropicの評価額を超えてる。もちろん、法律の最大限で罰せられるわけじゃない。彼らは2000年代初頭にNapsterを運営してたティーンエイジャーじゃないからね。

└

この考え方の問題は、何年もかけて素晴らしい役立つ本を書いて知識や知恵を共有してきた何十万もの教師たちが、自分の作品を盗まれたからって億ドル企業を訴えることはないだろうってこと。彼らがすることは、おそらく書くのをやめることだと思う。Anthropicが教師の作品を盗んで、彼らが二度と書かないようにするのには反対だよ。中にはもうそう言ってる教師もいる（カリフォルニアではないかもしれないけど）。

Hacker Newsで議論の続きを見る

ハクソク