世界を動かす技術を、日本語で。

主要なAWSの障害発生中

概要

  • ネットワークポリシー によるアクセス制限についての通知
  • ログインやアカウント作成 による制限解除の案内
  • スクリプトやアプリケーション利用時 の注意点
  • User-Agent設定 に関する推奨事項
  • サポートへの連絡方法 と必要情報の説明

ネットワークポリシーによるアクセスブロック通知

  • ネットワークポリシー によって、リクエストがブロックされた旨の通知
  • ログイン または アカウント作成 による再アクセスの推奨
  • スクリプトまたはアプリケーションを使用している場合、 開発者認証情報 での登録またはサインインの必要性
  • User-Agent が空欄でないか、 ユニークかつ説明的な文字列 であることの確認要請
  • User-Agent をカスタマイズしている場合、 デフォルトに戻す ことで解決する場合もある旨の案内

サポートへの連絡・問い合わせ手順

  • 誤ってブロックされた と考える場合や、 データ取得の相談 を希望する場合のサポート窓口案内
  • サポートに連絡する際は、 Redditアカウント情報 とともに、 表示されたコード の添付が必須
  • 問い合わせのための チケット提出ページ へのリンク提供
  • スムーズな対応のため、 詳細情報の提供 が推奨されること
  • 公式サポート経由 での問題解決手段

Hackerたちの意見

ああ、やばい…もしかしてラ・リーガがAWSでの海賊行為を見つけたのかな?

Vercelにも影響が出てるみたい。 https://www.vercel-status.com/ 私のウェブサイトがダウン中 :( (追記:ウェブサイト復活した、やった!)

注意して:NPMは「大丈夫」って言ってるけど(https://status.npmjs.org/)、パッケージが更新されなかったり、npm installが永遠に終わらなかったりしてる。依存してるなら、今はデプロイを控えた方がいいよ。

それにnpm auditもタイムアウトする。

そうそう。壊れてるのは監査の部分だね。危険だけど、--no-auditを使うのが一つの対策だよ。

AWSはインターネットの基盤だよね。ほとんどのウェブサイトにとっては単一障害点だし。Vercelみたいな他のホスティングサービスや、npmみたいなパッケージマネージャー、さらにはDockerのレジストリもこれのせいでダウンしてる。

この事件が進行する中で、どれくらいの追加時間がかかるかを推定する最良の方法は何だろう?私の直感では、障害が続くほど残りの予想時間が増える気がするけど、結局は過去の類似事件の分布に依存するよね。そういうデータはどこかにあるのかな?

私の理解では、主な問題はDynamoDBがダウンしていることだね。DynamoDBは多くのAWSサービスが裏でイベントシステムに使ってるから、たぶん5000億件くらいの未処理のイベントがあるんじゃないかな。全部オンラインに戻っても、処理するのに時間がかかりそうだね。

そうだね、事前の知識がなければ、数学的に正しい推定は「残り時間 = これまでの時間」だよ。でも、君が言うように、事前の知識があればもっと良い予測ができるよね。

DynamoDBはeu-central-1で正常に動作してるよ。どうやらus-east-1に限られてるみたい(https://health.aws.amazon.com/health/status)。あそこにはたくさんのコンソールやバックエンドのものがホストされてると思う。

ロビンフッドが完全にダウンしてる。メインのウェブサイトもダメだよね。: https://robinhood.com/

https://status.tailscale.com/ クライアントの認証がダウン中 :( 今日は最悪だね。

日曜日の夜10時にアシュバーンで停電があったんだ。3時40分頃に復旧したけど、データセンターは冗長な電源があるって知ってるけど、タイミングがすごく怪しいよね。停電は真夜中に始まったらしいし。

依存しているサービスがない間、世界が一時的にきれいになったような変な感じ。