概要
Bear Blogで初の大規模障害発生。 原因はリバースプロキシの過負荷と監視システムの通知失敗。 インターネット上の悪質なボット増加が背景。 対策として監視・リソース強化や透明性向上を実施。 今後もボット対策と安定運用を継続予定。
Bear Blog初の大規模障害とその背景
- 2025年10月25日、Bear Blogで初の大規模障害発生
- リバースプロキシ がダウンし、カスタムドメインがタイムアウト
- 監視ツール の通知失敗により、障害発見が遅延
- 影響を受けたユーザーへの 謝罪
障害の根本原因
- リバースプロキシ への過剰なリクエスト集中
- 近年増加する 悪質なボット によるDDoS攻撃や過剰スクレイピング
- 監視システムのプッシュ通知が 機能不全
現代ウェブのボット事情
- AIスクレイパー :ChatGPTやAnthropicなど、LLM学習用データ収集
- ユーザー主導の検索は許可、モデル学習用はブロック
- 悪質なスクレイパー :脆弱性探索や機密ファイル(.env/.aws)狙い
- 数百万件単位のリクエストを短期間でブロック
- IPアドレスを頻繁にローテーション、携帯ネットワークASNs利用推測
- アプリ開発者が無料アプリ経由でトンネル販売している可能性
- 無秩序な自動化 :簡単なスクリプトで大量スクレイピング
- 一般家庭PCでもVPSより高性能化、DDoSの温床
既存のボット対策
- CloudflareのWAFルールとレートリミット 導入
- 独自コードで不正ボットを検出・隔離
- Zip BombやProof of Work検証も検討したが、複雑化回避のため未導入
今回の障害の詳細
- 数百のブログがDDoS被害、数万ページ/分単位でリクエスト集中
- サーバー自体のスケーリングは機能、 リバースプロキシ がボトルネック
- 5年間無停止だったサーバーが初めてダウン
- 監視システム の通知漏れが復旧遅延を招く
- 通知設定やアプリ自体の問題は検証済みだが原因不明
今後の対策
- 監視の冗長化 :2系統の監視サービスで電話・メール・SMS通知
- リバースプロキシでのレートリミット・ボット対策 強化
- サーバー負荷を約半減
- リバースプロキシのリソース増強 :従来の5倍負荷に耐える設計
- 自動再起動機能 :2分以上帯域ゼロなら自動リスタート
- ステータスページ (https://status.bearblog.dev)新設で透明性向上
インターネットの現状と今後
- 公開インターネットの大半は ボット によるアクセス
- 悪質なボット増加で ウェブ運用の難易度上昇
- 良質なインターネット空間維持のため、今後も ボット対策と安定運用 を継続
- さらなる提案や相談は メール連絡 を推奨
まとめ
- ボットとの イタチごっこ は今後も続く
- 安定運用とユーザー保護のため 継続的な改善 に注力