概要
- uBlock Origin用のAIコンテンツファーム専用ブラックリスト の紹介
- AI生成コンテンツの問題点 とブラックリストの必要性を解説
- リストへのウェブサイト追加方法 や判別基準の説明
- AIコンテンツ判別のガイドライン やGoogle Dorksの活用法
- 類似プロジェクトとの差別化 についても言及
uBlock Origin用AIコンテンツファームブラックリストの概要
- uBlock Origin でAIコンテンツファームをブロックする 個人作成のブラックリスト
- GitHub で公開されており、 Pull Requestでの貢献歓迎
- 自動購読リンク または 手動でリストURL追加 による導入可能
- https://raw.githubusercontent.com/alvi-se/ai-ublock-blacklist/master/list.txt
- 主な目的 は、AI生成の低品質・無価値なコンテンツや広告だらけのサイト排除
なぜAIコンテンツをブロックするのか
- AI生成記事 は有用な情報がなく、 広告やアフィリエイトリンク で収益化狙い
- 人間による経験や独自性 を求めて検索するユーザーの期待に反する内容
- AIコンテンツの危険性
- 誤情報、危険なアドバイス(例:危険なコマンドや化学物質の混合)
- 事前チェックなし で大量公開されるリスク
- リストは手動追加 で精度重視、アルゴリズム判定は未採用
ブラックリストへのウェブサイト追加方法
- 非技術者向け :GitHubのIssue機能で疑わしいサイトを報告可能
- 技術者向け :Pull Requestでlist.txtファイルに追記
- ドメイン単位または特定ブログ単位で指定
- 例:
||example.com/@slopUser^$doc(特定ブログ) - 例:
||example.com^$doc(ドメイン全体)
- 例:
- ドメイン単位または特定ブログ単位で指定
- SEO業者やデジタルマーケティング会社 が運営する複数サイトも調査・追加推奨
AIコンテンツファームの特徴と判別ガイドライン
- 不要な序文・結論 :内容に関係ない冗長な導入文
- 典型的なタイトル :"A Comprehensive Guide"や"Ultimate Guide"など
- 外部リンク・出典の欠如 :信頼性の低さ
- アフィリエイトリンクだらけ
- 企業の商品紹介 に偏った内容
- 短期間で大量の記事投稿 :同一著者によるスパム的運用
- 誤情報(AIの幻覚) :明らかな間違い
- 2022年11月以降の記事 :ChatGPT公開以降のAIブーム
- 画像や動画など非テキストメディアの少なさ
- AI生成画像・ロゴの使用
- Markdown記法のまま未整形
- 長文だが本筋から逸れる内容
- 検索エンジン上位常連 :SEO悪用
- 幅広い分野を扱う知ったかぶりブログ
- 見出しだけ多く内容が薄い記事
- 連絡先がGmail等の無料メール
- 曖昧な運営者情報やaboutページの不備
- AI推しの内容(ChatGPT絶賛など)
Google DorksによるAI生成ページの発見
- AIが自ら正体を明かす表現 をGoogle検索で特定
- 例:"Sure! Here's an article about"(英語)、"Certo! Ecco un articolo"(イタリア語)
- これらのフレーズを引用符で囲んで検索 し、該当ドメインをブラックリストに追加
類似プロジェクトとの違い
- uBlockOrigin & uBlacklist Huge AI Blocklist はAI関連全体をブロック対象
- 本リストは「AIコンテンツファームのみ」 を対象とし、 正当なツールやサービスは除外
まとめ
- AI生成コンテンツファームの識別・排除 を目的としたユーザー主導型ブラックリスト
- 人間の経験や独自性を重視 したウェブ体験の保護
- コミュニティ参加型でリスト拡充 を推進