AIは単なる無許可の盗作を大規模に行っているだけだ

2026年5月21日原文(axelk.ee)

概要

AI企業が著作権者の同意なく学習を行い、その成果を販売している現状についての批判。 AIによるコンテンツ生成がオリジナル作者に不利益をもたらしているという懸念。 AI利用者がさらに生成物を販売し、利益を得ている実態。自分のオリジナル記事がAI経由でコピーされ、検索順位で不利になっている体験談。 Googleの検索アルゴリズムへの不満。

AIによる著作物の無断学習と収益化問題

AI企業 が著作者の 同意なく インターネット上の情報を学習データとして利用
学習結果を 商品化 し、人間へ販売するビジネスモデル
オリジナルの著作者に 報酬や補償が一切ない 現状
AIツール利用者 が生成物を他者へ再販し、さらに 利益を得る 構図
インターネット上の多様な著作物が 無断でコピー・活用 されている実態

オリジナル著作者が受ける不利益

独自執筆 したeコマース系チュートリアル記事の事例
他サイト運営者 がChatGPTなどのAIで人気記事を コピー生成 し、 自サイトに転載
コピー記事がGoogle検索で 上位表示 される逆転現象
コピー記事内に 自分のサイトへのリンク や リンクテキスト がそのまま残るケース
AIやGoogleの仕組み によって、オリジナル著作者が 評価されない 現状

AI技術と倫理的課題

人間の怠惰や貪欲さ が加速するAI時代への疑問
創作活動の価値低下 や 著作権侵害 の懸念
倫理的配慮や法整備 の必要性

Google検索アルゴリズムへの不満

コピーサイト が オリジナルより高順位 に表示される問題
検索エンジンの 品質評価や公正性 への疑問
Googleの責任 と今後の改善要望

Hackerたちの意見

彼らの記事には、私の実際のウェブサイトへのリンクが載っていて、そのリンクテキストもそのままなんだけど、何が問題なのか全然わからない。リンクテキストがすごく長くない限り、なんで誰かがあなたの記事にリンクするのに違う言葉を使うの？

└

そう、それは引用して出典を示すことだね。

└

たぶん、彼らはセクションヘッダーを自分たちのウェブページにリンクさせてたんじゃないかな。これ、あまりうまく書かれた愚痴じゃないね。

└

彼が言ってるのは、自分のウェブサイトのURLをチュートリアルの例に使ってて、他のチュートリアルもそのままコピーしてるってことじゃないかな。

└

時々、リンクが .../post/{id}/{extra-text} の形を取ることがあるんだけど、extra-text は投稿を一致させるためには全く使われてないんだ。アマゾンのリンクも（昔は？）こんな感じで、商品名がリンクの最後に追加されてるけど、削除したり変更したりしても商品にリダイレクトされるんだよね。もしかしたら、著者はLLMがリンクの無関係な部分をそのまま提供してることに驚いてるのかも。

└

2つのウェブページがあると想像してみて。1つはアップルフリッターのレシピ、もう1つは味でリンゴを非公式にランク付けしたものだとする。あなたのアップルフリッターのレシピがそのリンゴのランキングリストにリンクしているとしよう。後で、誰かがあなたのレシピをクレジットなしでコピーしたことに気づくけど、それでもあなたのレシピと同じ言葉を使ってリンゴのランキングリストにリンクしている。彼らはあなたの記事を盗んでいるにもかかわらず、GoogleのSERPや広告収入をあなたよりも多く得ている。問題が見える？

元の情報源が正当に評価されないという広い問題は残ってる。ウェブサイトの運営者は、自分たちのコンテンツをホストするためにお金を払ってるんだから、クローラーが来てそれをインデックスしてAIに取り込む。運が良ければ引用されるかもしれないけど、コンテンツ提供者にとっての報酬はほとんどない。もちろん、これはどんどん悪化してるよね。AIが全てをやってるのに、なんでウェブサイトを見る必要があるの？それに対抗するためには、クローラーをブロックして、すべてをログインの裏に隠す必要があるかもしれない。

└

さらに悪いことに、AIによる常時スクレイピングは、コンテンツ提供者にとって追加のコストになってるけど、リターンはない。少なくともGoogleやBing、Yahooのスクレイピングは、あなたのコンテンツへのリンクを提供するために使われてたのに。

└

約1年前に、OpenAIが私が働いている会社をクローリングして、DDOS攻撃を仕掛けたんだ。robots.txtがそれを許可していないのに、しかもタイミングよく組み立てたrecaptchaもあったのにね。私たちのデータが彼らのモデルの出力に見つかったけど、誰がそれに対して何かできるっていうんだ…

└

コンテンツにアクセスするためのプルーフ・オブ・ワークの仕組みを考えてたんだけど、要するに著者のためにクリプトをマイニングしなきゃいけないってやつ。でも、このアイデアは今の時代には受け入れられないかもね。

└

検索エンジンで見つからないようにウェブサイトをホスティングすることって可能なのかな（つまり、クローリングされないことを願ってる）？見つけやすさには影響があるのは分かってるけど、それが問題じゃなかったら、どうやってクローリングを回避できるのか興味がある。

└

実際、彼らにはお金や時間がかかってるんだよ！友達が大学でシステム管理者をやってて、AIクローラーが彼のサーバーをDDoS攻撃してくるのに常に対処してる。彼が言うには、Anthropicが最悪の offenders の一つなんだって。これらのAI企業は「コストを社会化し、利益を privatize する」というモットーのひどい例そのものだよ。気持ち悪い！

Hacker Newsで議論の続きを見る

ハクソク