世界を動かす技術を、日本語で。

停電後、アマゾンは上級エンジニアにAI支援の変更を承認させる方針

概要

  • Amazonが通常は任意参加の会議への出席をスタッフに要請
  • AI支援による変更にはシニアエンジニアの承認が必須に
  • AWSでAIコーディングツールによる障害が複数発生
  • 人員削減後の障害増加に関する社内の声と会社の反論
  • 障害の影響範囲や今後の運用改善方針についての説明

Amazonによる会議出席要請とAI運用強化

  • Amazon は通常 任意参加 である会議への出席をスタッフに要請
  • TWiST は小売テクノロジーリーダーとチームによる週次運用会議
    • 店舗運営パフォーマンスのレビューを実施
  • ウェブサイト可用性の見直し は「通常業務の一環」と説明
    • 継続的な改善を目指す姿勢

AI支援変更の承認プロセス強化

  • ジュニアおよびミッドレベルエンジニア によるAI支援変更には
    • シニアエンジニアの承認 が必須に
  • AI活用のリスク管理 を強化する方針

AWSにおけるAI関連障害事例

  • Amazon Web Services (AWS) でAIコーディングアシスタント起因の障害が少なくとも2件発生
    • Kiro AIコーディングツール による環境の「削除と再作成」で13時間の中断
      • 2023年12月中旬、コスト計算ツールで発生
      • 影響は中国本土の一部サービスに限定
    • 2件目の障害は「顧客向けサービス」には影響なし

人員削減と障害増加に関する見解

  • Amazonエンジニア によると、事業部門で「Sev2」インシデントが増加
    • 「Sev2」は迅速な対応が必要な障害
    • レイオフ が影響しているとの声
  • Amazon は人員削減が障害増加の原因であることを否定
    • 2024年1月に 16,000人のコーポレート職 を削減

今後の運用改善と対応方針

  • AIツールの利用拡大 を進めつつ、リスク管理体制を強化
  • 会議や承認プロセス の厳格化による運用の安定化を目指す方針