概要
- NVIDIA がAIブームで巨額の利益を得ている現状
- 著作権侵害 を巡る作家たちの集団訴訟
- Anna’s Archive など“シャドウライブラリ”との関与疑惑
- 訴訟は 米国カリフォルニア北部地区連邦地裁 で進行中
- 今後の法的・業界的影響に注目
NVIDIAとAI著作権訴訟の概要
- NVIDIA はAIチップとデータセンター事業で 急成長
- 独自AIモデル( NeMo, Retro-48B, InstructRetro, Megatron)の開発・学習
- 学習データに 大規模テキストライブラリ を活用
- 他のIT大手同様、 著作権者からの法的反発 を受ける状況
作家によるNVIDIAへの著作権侵害訴訟
- 2024年初頭、複数の作家が NVIDIAを著作権侵害で提訴
- 集団訴訟の内容: Books3データセット が“海賊版”サイトBibliotik由来
- 無断利用による損害賠償請求
- NVIDIA側は“フェアユース” を主張し、「書籍は統計的相関に過ぎない」と反論
- しかし、訴訟過程で 新たな証拠 が発見される
Anna’s Archiveとの接触疑惑
- 2024年6月、訴状が拡大され 新たなAIモデル・書籍・著者 が追加
- 内部メール等から、 NVIDIAがAnna’s Archiveに直接接触 したと主張
- データストラテジーチームが「 高速アクセス」の条件を問い合わせ
- Anna’s Archive側は「 違法性」を警告
- 数日後、 NVIDIA経営陣が“ゴーサイン” を出し、500TB規模のデータアクセス権を取得
- 提供データには Internet Archive の電子貸出システム経由の書籍も含む
その他の“シャドウライブラリ”利用疑惑
- LibGen, Sci-Hub, Z-Library など他の“海賊版”ソースも利用疑惑
- Books3 以外のデータセットにもアクセスした可能性
二次的・共同侵害の主張
- NVIDIA が自社AI学習だけでなく、顧客向けに自動ダウンロード用ツールやスクリプトを配布
- 例:「 The Pile」データセット(Books3含む)の自動取得
- これにより 共同・間接侵害 による収益化も指摘
- 損害賠償請求は 原告作家だけでなく、将来参加する可能性のある多数の著者 にも及ぶ
今後の展望と業界への影響
- Anna’s Archive とのやり取りが米大手IT企業で初めて公になった事例
- “シャドウライブラリ”の存在感が一層拡大
- 訴訟の行方次第で AI開発と著作権問題 の業界基準・規制強化の可能性
- 訴状は 米国カリフォルニア北部地区連邦地裁 に提出済み
- 代表的な原告作家: Abdi Nazemian, Brian Keene, Stewart O’Nan, Andre Dubus III, Susan Orlean
まとめ
- NVIDIA はAI時代のリーダーである一方、著作権侵害疑惑で厳しい法的局面に直面
- “シャドウライブラリ”との関与問題がAI業界全体のリスクとして浮上
- 今後の訴訟動向と判決が AI開発と著作権の新たなルール を形作る可能性