世界を動かす技術を、日本語で。

HN Searchは金曜日以来新しいデータを取り込んでいません

概要

  • algolia/hn-search リポジトリで新規データの取り込み停止
  • 問題は 2025年8月17日 に報告
  • HN API 自体は正常に動作
  • フロントページのデータ とAPIの一致を確認
  • 担当者・ラベル・マイルストーン等は未設定

HN Searchが新規データを取り込まない問題

  • algolia/hn-search リポジトリにて新規データのインジェスト停止
  • 2025年8月17日 にspiffytech氏がIssueとして報告
  • 金曜の夕方 以降、検索結果が更新されない現象
  • HN API をスポットチェックした結果、ライブのフロントページと一致
  • 問題の発生箇所が algolia/hn-search であると判断
  • Issueには 👍リアクション が多数(48件以上)
  • 担当者・ラベル・マイルストーン 等は未設定
  • 関連する ブランチやプルリクエスト もなし
  • 現時点で 開発の進捗や解決策 の提示なし

今後の対応・確認事項

  • algolia/hn-search 側でのデータ取得プロセスの調査
  • 必要に応じて 担当者のアサインラベル付与
  • ユーザーからの追加報告や技術的な詳細 の収集
  • API側の一時的な問題仕様変更 の有無も再確認
  • 問題解決後の 通知やアップデート の実施

Hackerたちの意見

他の人もこれを投稿してたけど…見つけるのは難しいよね。hn.alogliaを使ってる人はたくさんいるし、フロントページよりずっと使いやすいよ。

昨晩、何人かのユーザーからアプリの時系列データが金曜日から古くなってるってメールが来て気づいたんだ。それでGitHubに行ったら、すでに問題がオープンになってて、他の8人にアップボートされてたよ。

フロントページとして使ってるんだけど、フラグ付きの投稿を表示して、投票数でランク付けしてるから、難解なアルゴリズムじゃないんだよね。

https://hcker.newsを試してみて(私が作ったんだ)、フロントページのインターフェースはHN用に作ってあるよ。algoliaサイトでできることはほぼ全部キャッチしてるし、それ以上のこともできる。ほとんどのHNフロントエンドはalgoliaのAPIに頼ってるけど、私はそれに依存してないから、ダウンタイムにも強いんだ。

代わりのフロントページを探してるなら、hckrnews.comは何年も使ってるよ。フロントページのトピックをリストにしてくれて、今の時間に合わせてリストを絞り込めるんだ。

早く直るといいな。HNのFirebaseを使うために拡張機能のフォールバックを書かなきゃいけなかったけど、必要なデータにはあんまり効率的じゃないんだよね。

うわ、じゃあどうやって他の人より最新のsimonwやrachelbythebayの投稿に勝ったか分かるの?

「from site」機能はHNにネイティブであるんだよ。多分冗談だと思ってるかもしれないけど、これはいい機能で、まだ知らない人もいるかもしれないよ。投稿の横にあるURLをクリックすると、そのサイトからのすべての投稿が表示されるんだ。

みんなごめん。Algoliaチームには知らせたから、今対応中だよ。

こういうことは前にもあったし、また起こるだろうね。障害は起きるものだし、次回Algolia側で何かあったときに連絡するのに最適な連絡先やエスカレーションの方法を教えてもらえる?

ちなみに、HN Repliesも1、2ヶ月前から使えなくなっちゃった。なんでかわからないけど(多分、メールかドメインに関係してると思う - 再登録してもダメだったし)、もし調べるチャンスがあったら感謝するよ。

遅れてごめんね。今、見逃したストーリーやコメントを補填してるところだよ。ほぼ終わりそう。下の方に更新を投稿したけど、ここが一番上のコメントだから投稿したかったんだ。何が起こったのか、そして今後の計画についてのアップデートを数日中にするからね。

たまたま「手動」でウェブサイトをチェックしてたんだけど、hnrss.orgが更新を止めてたから、これで理由がわかったよ(笑)。早く解決することを願ってる。

Googleで検索したり、LLMを使ったりすれば、HNもインデックスされてるよ。

こういうスレッドがあってよかった。前にも似たようなことがあったみたいだし。特定のIPレンジを使ってると、検索が禁止されることもあるよね。ブロックなしで、もっとしっかりした検索ができるといいな。

みんな、遅れてごめんね。今調査中で、何が起こったのかちゃんとお知らせするから。もう少ししたら更新するね。

ちょっとしたアップデート。見逃したコメントやストーリーを補填してるところだよ。検索結果ページに表示され始めるはず。全部追いついたらまた更新するね。本当にごめん、何か進展があるまで更新を送らないつもりだったんだけど、毎回もう少しで近づいてる感じだったから。ここで何が起こったのか、そして学んだことについてHNのアップデートもするつもりだよ。(ネタバレ注意:所有権が10年でごちゃごちゃになってたから、クローリングが止まった部分がどう機能してたのかを理解する必要があったんだ。それは楽しかったよ。ここで明確な計画を立てて、透明性を持たせるようにするから、本当にごめんね :( )

RSSも壊れてたの?少なくとも、https://hnrss.github.io/ は壊れてたよ。

そうみたい。もうRSSの通知が来なくなったし。

うん、昨日気づいたら、すべてのアイテムが数日前のものだった。今はちゃんと動いてるみたい。

このダウンタイムのおかげで、溜まってた記事を片付けられたよ。フィードを更新する頻度も減らしたし。いいこともあるね :)

HN Searchのデフォルトがイマイチだよね。「全期間の人気ストーリー」とか、最近のコンテンツがほとんど出てこないし、コメントやストーリーが多い。