CloudflareがAIボット向けの従量課金型クローリングを導入予定

2025年7月1日原文(blog.cloudflare.com)

概要

Cloudflare が提案する新しい「Pay per crawl」モデルの紹介
コンテンツ制作者 がAIクローラーへのアクセスを柔軟に制御・収益化可能
HTTP 402 Payment Required の活用による課金フローの実現
技術的認証 や価格設定など、運用面の詳細
今後の エージェント時代 への展望

コンテンツアクセスの新たな選択肢：Pay per crawl

従来、 AIクローラー への対応は「全面許可」か「完全遮断」の二択
Cloudflare は、制作者が「誰に」「どのように」コンテンツを提供するかを選択できる仕組みを重視
「Pay per crawl」により、 AIクローラーからのアクセスごとに課金 が可能
HTTP 402（Payment Required）を活用した 標準化された課金プロトコル
Cloudflare が商取引の記録・決済インフラを提供

パブリッシャーのコントロールと価格設定

ドメイン単位で「許可」「課金」「遮断」の三つの選択肢
- 許可：無料でアクセスを許可
- 課金：設定価格でアクセスごとに課金
- 遮断：アクセス自体を拒否
特定のクローラーのみ無料許可や、外部交渉も柔軟に対応可能
既存の WAFやボット管理 機能と連携し、セキュリティを維持

技術的認証と課金フロー

クローラーは Ed25519鍵ペア 生成と公開鍵ディレクトリの登録が必要
Web Bot Auth 提案に準拠した署名付きリクエストを送信
課金フローは2種類
- リアクティブ型 ：初回リクエストでHTTP 402と価格提示、同意時に再リクエスト
- プロアクティブ型 ：最初から支払意思を示すヘッダーを付与
価格同意時のみ HTTP 200 OK でコンテンツ提供、課金イベント記録

決済および収益配分

Cloudflareアカウント で支払い・受取情報を設定
各リクエストごとに課金イベントを記録し、集計後に決済・収益分配
すべての課金・アクセス履歴を管理

エージェント時代への展望

Pay per crawl はインターネットでのコンテンツ価値化と制御の新潮流
将来的には、 動的価格設定 や 利用用途別ライセンス にも発展可能
エージェント が自律的にコンテンツ購入・交渉する時代への布石
HTTP 402ベースにより、 プログラム的なアクセス交渉 が可能

導入方法とCloudflareの案内

現在は プライベートベータ で運用中
興味があるクローラー運営者やコンテンツ制作者は、 Cloudflare公式サイト から申込可能
Cloudflareは セキュリティ、アプリ高速化、DDoS対策 など多彩なサービスを提供
詳細・キャリア情報は Cloudflare公式サイト 参照

Hackerたちの意見

全体的にはそのアイデアには賛成だけど、ビッグテックが消費してるデータ量を考えると、CFをバイパスする方が安く済むと思う（Googleは検索で無料で手に入れるしね）。もし成功したら、エージェントがこのコストをユーザーにどう転嫁するのか気になるな。

└

もっと多くの出版社がGoogleのボットをブロックし始めるだろうね。だって、GoogleはAIの結果で収益を奪ってるから。

└

「Googleは無料で手に入れるだろう、なぜならGoogle検索だから」もし次のステップが、Googleが訪れるページに対して支払うことだとしたら？ページごとのクローラーフィーを設定することで、ニュースサイトは大きな料金が支払われない限り、いくつかの記事をクローリングできなくすることができるかもしれない。考えを整理しているだけだけど、さまざまな「ライセンス」によって価格を定義するプロトコルが簡単に想像できるよ。例えば「内部使用」、「再配布」（Googleニュースがやってること）、「LLMトレーニング」など。Cloudflareは何百万ものウェブサイトの中心的なポイントとして、これを可能にするんだ。

この面倒な問題に取り組んでる人がいるのはいいね。ボットトラフィックが増えてるのを実感してるし、データをむしゃむしゃ食べてる感じだ。でも、Cloudflareに頼るんじゃなくて、クローラーやスクレイパーのためのオープンソースプロトコルがあった方がいいと思う。

└

Cloudflareが提案してるプロトコルは、誰でも実装できるものだよ。クローラーが登録して支払う方法が必要になるね。CFは商取引の記録を持ってるから、請求するのは彼らだろうけど、どれくらいの手数料を取るのか（もし取るなら）や、バンドルサービスに含まれるのかは不明だね。これを拡張して、以下のことを可能にするべきだと思う：* マイクロペイメントとサブスクリプション * ブラウザのUI/UXとの統合 * 複数の通貨 * UPIやNPP、FedNowなどの国の即時決済システムを含む複数の決済システムの実装。

└

これは企業がモデルのトレーニングのためにデータを集めてるのか、それともユーザーの代わりに動いてるエージェントツールなのかな？

└

支払いを望まないなら、こちらがあるよ: https://anubis.techaro.lol/ 例えば、https://gcc.gnu.org/bugzilla/ で使われてる。CAPTCHAやターンスタイルよりも面倒じゃないし、作業証明が自動で動くからね。

これは基本的にマイクロペイメントをどうやってやりたいかってことだね。最近Coinbaseが同じようなことを暗号通貨と402ステータスコードを使って導入したみたい。実際、x402って呼ばれてるよ。 https://github.com/coinbase/x402

└

これがウェブの標準的なビジネスモデルになるべきだよ。広告の仲介業者がメディアを腐らせて、データを永遠に搾取してるのは良くない。これがプロパガンダを広めたり、民主的なプロセスを腐らせたり、ここ10年以上の社会政治的不安を引き起こしてるんだ。数十年後には、これがどれだけ悪質だったかを受け入れて、タバコ業界と同じようにこれらの企業を起訴したり規制したりできるといいな。ブレイブのBATもこの問題を解決しようとするいい試みだけど、x402はもっと一般的な解決策に見える。どちらも、暗号通貨の偏見や広告技術が現在のウェブをしっかり握っているせいで、 tractionを得るチャンスがないのが残念だね。

これ、完全に間違った方向に進んでる気がする。これがやってるのは「はい、クローリングの作業はそのまま続けて、ただ今はもっとお金を払ってね」ってこと。Cloudflareはこの追加コストに対して価値を提供しようとしてない。ウェブをクローリングすることは、これらのAI企業や挑戦者の検索エンジンにとって競争優位性じゃないし、ただのコストで大きな気晴らしだよ。彼らは共有インフラで協力すべきだと思う。いろんな会社が独立してサイトにアクセスするんじゃなくて、みんなが貢献する単一のクローラーが必要だよ。フィルターを設定して、フィルターがURLに一致する人は比例して貢献する。変換（例えば、HTMLからMarkdown、テキストから埋め込み）を設定して、変換を共有する人も比例して貢献する。これによって、ウェブサイトへの負担が大幅に減るはず。みんながサイトにアクセスする代わりに、たった一つのクローラーがアクセスすることになるし、いろんなクローラーがrobots.txtを正しく守ることを期待する代わりに、技術的かつ契約的にそれを強制できる。クライアントにはブロックされたコンテンツが届かないし、どうしても欲しいなら、自分でクローラーを実装して維持する必要がある。それは、ただの住宅IPを通してプロキシするよりもずっと魅力がないよね。もし支払いを追加したいなら、まあ、いいけど。それで多くの人が報酬を得られるとは思えない。まだ見られていないコンテンツのために自動支払いを設定するのは誰だろう？自動生成された無駄なページにお金を払うだけになるよ。ここには、AI企業や検索エンジンがクローリングをより簡単で安くする解決策があるはずなのに、Cloudflareは「いや、ただ払え」って言ってるだけ。全然想像力がないし、魅力的でもないね。

└

でも、この新しいコストって協力する直接的なインセンティブを生むんじゃない？

└

ここでのインセンティブ構造について、君は市場の間違った側面を見てると思う。コンテンツプロデューサーはトラフィックに悩まされるのは気にしないけど、そのトラフィックに対してお金がもらえるかどうかは重要なんだ。もし8社が私のサイトのすべてのページを1日に10回訪問したいなら、それは問題ないよ。ただし、市場価格に近い金額をもらえるならね。その8社は、コストがコンテンツプロデューサーに外部化されなくなるから、統一されたクローリングスキームで協力するインセンティブが生まれるはず。これが君の望む結果につながり、コンテンツプロデューサーが報酬を得られるようにするべきだと思う。

Hacker Newsで議論の続きを見る

ハクソク