AI企業、特にAIスクレイパーは、WWWの残りを壊している癌だよ。昨日、かなり大規模なボットネットによる「分散スクレイピング」攻撃を受けた。- 約400,000の異なるIPアドレスが約3時間で - 主に住宅IPアドレス - 有効でユニークなユーザーエージェントとリファラー - 各IPアドレスはリクエスト間に長い遅延を置いて、数回だけリクエストを送る。サーバーに負荷がかかって、応答が遅くなるまで攻撃して、その後約30秒間バックオフして、また強く攻撃してくる。ユーザーエージェントとリファラーパターンの組み合わせで大半のリクエストをブロックできたけど、正当なユーザーがブロックされる可能性もある。攻撃はうざかったけど、もっと大きな問題は、このウェブサイトのデータがライセンス下にあること。俺たちはそれにお金を払わなきゃいけなくて、安くはない。広告収入といくつかのサブスクリプションでなんとか支払えてるけど(ギリギリ)、もしみんながそのデータを「エージェント」やスクレイパーから得ているなら、広告収入がなくなって、すぐにスクレイピングするウェブサイトもなくなって、仕事も失って、スクレイパーがデータを得る場所もなくなって、正当なユーザーが無料でデータを得る場所もなくなるってことだ。