GPUHammer: GPUメモリに対するRowhammer攻撃は実用的である

概要

GPUメモリアクセスはCPUの最大4倍遅く、 シングルスレッド では必要なアクティベーションレートに到達不可
GPUの SIMT並列性 を活用し、マルチスレッド・マルチワープで同時実行
- メモリコントローラのアイドル時間を削減し、 最大ハンマリングレート を達成

先行研究（SMASH/BlackSmith）から、 リフレッシュ同期 がDRAM防御回避の鍵と判明
CUDAの同期プリミティブではワープ実行順序が乱れるため、 ワープ毎の遅延挿入 でリフレッシュとハンマリングを同期
- TRR等の インDRAM防御 を回避しつつ、ワープ順序の維持を実現

NVIDIA RTX A6000（48GB GDDR6）で全4バンクに対し 8件のシングルビット反転 を観測
最小アクティベーション回数（TRH）は約12,000回で、DDR4の先行事例と同等
MLモデル精度劣化攻撃 を世界初実証
- FP16重みの指数部ビット反転で、ImageNetモデル5種の精度を80%→0.1%まで低下
- 単一ビット反転 で大幅な精度劣化を誘発可能

どのGPUが脆弱か？
- NVIDIA A6000（GDDR6）でビット反転を確認
- RTX 3080（GDDR6）では未確認、A100（HBM）も未確認
- DRAMベンダ・チップ特性・温度等で挙動が異なる可能性
なぜテストGPUが少ないのか？
- GPUのDRAMは基板直付け・高額で大規模検証が困難
- 攻撃コードは他Ampere世代GPUにも拡張可能、今後の研究に期待
GPUHammerの緩和策は？
- ECC有効化 （nvidia-smi -e 1、再起動必要）で全ビット反転を訂正可能
  - ただし性能最大10%低下、メモリ容量6.25%減少
  - 根本解決にはGDDR6自体のハードウェア設計見直し（PRAC/PRIDE等）が必要
H100やRTX 5090等の新世代GPUは安全か？
- 現状は オンダイECC 搭載で単一ビット反転はマスクされる見込み
- 将来的にマルチビット反転パターン（ECCploit等）が現れる可能性
NVIDIAへの情報開示と対応は？
- 2025年1月15日、NVIDIAおよび主要クラウド事業者に責任ある開示を実施
- NVIDIAは問題を認め、ECC有効化を推奨

詳細は USENIX Security 2025論文、GitHubおよびZenodoで成果物公開
論文引用例：
- @inproceedings{lin2025gpuhammer, author = {Chris S. Lin and Joyce Qu and Gururaj Saileshwar}, title = {GPUHammer: Rowhammer Attacks on GPU Memories are Practical}, publisher = {USENIX Association}, booktitle = {Proceedings of the 34th USENIX Conference on Security Symposium}, year = {2025}, series = {SEC '25}, address = {USA}, location = {Seattle, WA, USA}, }