世界を動かす技術を、日本語で。

Google ブックスがプレビュー付きの書籍に対するすべての検索機能を削除しました

概要

  • ネットワークポリシー によるアクセスブロックの通知
  • アカウント作成 やログインでの回避提案
  • スクリプト利用時 の追加手順説明
  • User-Agent 設定の重要性
  • 問い合わせ方法 の案内

アクセスブロック通知について

  • ネットワークポリシー によりアクセスがブロックされている状態
  • Redditアカウント でのログインや新規作成によるアクセス回復案
  • スクリプトやアプリケーション 利用時は、開発者認証の登録やサインインが必要
  • User-Agent が空欄の場合は、ユニークかつ説明的な値の設定が必須
  • 独自User-Agent が原因の場合は、デフォルト値への変更も推奨
  • 誤ってブロックされた場合 やデータ取得の相談は、専用チケット提出フォームで対応
  • 問い合わせ時には Redditアカウント 情報と表示された コード の記載が必要

ブロック解除・問い合わせ手順

  • Reddit公式ログインページ またはアカウント作成ページへのアクセス推奨
  • 開発者向け登録ページ での認証手順
    • スクリプトやアプリケーション利用時の必須手順
  • User-Agent 設定の見直し
    • 空欄や一般的でない値はブロック原因
    • デフォルト値や独自値の切り替えで再試行
  • サポートチケット提出 による問い合わせ
    • フォームへの Redditアカウント表示コード の記載が必要
  • データ取得に関する相談 やブロック解除依頼も同フォームで受付

Hackerたちの意見

簡単だよ。ライブラリジェネシス、アナのアーカイブ、スカイハブをチェックしてみて。海賊行為は、買うことが所有を意味しないなら、盗みじゃないからね。

これらはどれも全文検索ができないよ。

情報をオープンにしようとしてるのが、逆に犯罪者って皮肉だよね。

LLMが海賊版の素材でトレーニングされることについて、みんながどう感じてるのか、めっちゃ気になるんだよね。別に皮肉じゃないよ。君のコメントは、昔の「情報は自由であるべき」っていう考え方を反映してると思う。HNやSlashdot、Redditみたいなところでよく見られたやつね。でも、LLMが登場してからは、ここで一番声が大きい人たちがトレーニングデータに関しては逆の意見を言ってる気がする。みんなの考え方が本当に変わったのか、それとも今はただ声を上げる人が変わっただけなのか、理解しようとしてるんだ。

ミッションステートメントを更新する時期かもね。「私たちの使命は、世界の情報を整理し、普遍的にアクセス可能で役立つものにすることです」

  • 私たち、広告主、そして私たちのAIモデルのために。

ほぼ間違いなく、選択の問題じゃないよね。

おそらく、スクレイピングされているのを検知して、予防策としてこれをやったんじゃないかな。

AIのトレーニングによって著作権の状況が変わったから、これらの出版社はもうGoogleにそのデータを使わせたくないんだと思う。

20年前にSCOTUSまで戦った時より、今は出版社と仲良くなってるんじゃないかな。「検索を削除して?」 「いいよ、どうせお金かかってたし。」

検索でプレビューが周りの言葉と一緒に表示されると、引用符を使ってどんどん大きな部分を抜き出すのが簡単になっちゃう。最終的には本全体を得られるかも。

アナのアーカイブ: 「人類史上最大の本当にオープンな図書館」

ミラーサイト https://open-slum.org/

自分はほとんどGoogle Booksを公共ドメインの本や古い雑誌、新聞にしか使ってないから、特に問題は感じてないよ。もしかしたら、この人が思ってるほど死んでないのかも。

検索結果がかなり良かったのに、今は完全にゴミになったね。 https://bsky.app/profile/adamnemecek.bsky.social/post/3mdbup...

そのことは投稿で触れられてたよ。読んだときに見逃したんじゃないかな?「数日前に、プレビューがある本の検索機能を全部削除したんだ。特に現代の本が多い。」

Google BooksはNetflixみたいなサブスクリプションサービスになれたはずだよ。そしたらめっちゃ便利だったのに。

プレビュー機能は出版社との契約で与えられてるから、ある本にはあって、ない本にはないんだよね。ほぼ確実に、出版社がプレビューの削除を要求したんだと思う。著作権が切れた本は、まだフル検索と表示ができるから、Googleを責めるんじゃなくて出版社を責めて。

プレビューはまだあるけど、ランキングには入ってないね。

LLMが本を違法に消費することについての議論を考えると、出版社はちょっと心配してるかもね。特に、現代の作品の部分的なプレビューを組み合わせたLLMが、そのテーマに関する一般的な本の市場を壊す可能性があるから。この機能を通じて適切にライセンスが与えられた場合ね。

長すぎる著作権の期間が悪いと思う。著者の死後70年、または出版から95年経って、最近の作品が実質的に100年後、もしくはそれ以上に公共のものになるっていうのはね。

じゃあ、あるテキストが一つのチャンクの最後にあったら、次のチャンクのプレビューが表示されるの? それに、これらのチャンクをつなげたら本全体が見れるのかな? もしそうなら、誰かがこれを使って本を抜き出すこともありそう。

君が言ってるのは本の中の検索のことだね(TFAは全ての本を対象にした検索のこと)。確かに、昔はほぼ全ての本を抜き出すための技術として知られてたんだ。それで出版社は、検索から本の一部を除外するように対応したんだよ(ページはリストに表示されるけど、見れない)。それに、個々のGoogleアカウントは、標準のプレビューページを超えて特定の本の追加ページをどれだけ見ることができるか制限されるようになった。でも、その後LibGenやZ-lib、Anna's Archiveが人気になって、コレクションが増えていったんだ。

確認したけど、プレビュー付きの本の中を検索するのはまだできるよ。(a) books.google.comで検索してプレビューのある本を見つけると、新しい本のビューワーが開くんだ。検索はページの下の方にあるよ。「すべて表示」をクリックすれば、その本の中での検索結果を全部見ることができる。(b) 本のホームページに行くと(ビューワーが開いてたら右上のXをクリック)、タイトルの下に「プレビュー」ボタンの横に「本の中を検索」がまだあるよ。

でも、どの本を探してるかを知っておかないとね。

過去の自分に送りたい、あまり重要じゃないことの中で一つ:「デジタル化された本の抜粋の流行は逆転するから、時間が経つにつれて見つけるのが難しくなるよ。だから、引用したいものは自分でコピーしておけ。」