概要
- AMDはAIソフトウェアスタックROCmを強化し、NvidiaのCUDAに挑戦中
- Nod.ai買収によりAIコンパイラ技術を獲得し、AIスタックの統合を推進
- TritonやMLIRなど、オープンソース技術でGPU間のポータビリティを向上
- 開発者コミュニティとの直接的な対話を重視し、迅速なフィードバック対応を実施
- 今後10年使えるプラットフォームを目指し、ROCmの差別化機能も検討中
AMD、ROCmでCUDAに挑む ― 一歩一歩の前進
- AMD はデータセンター向けGPU市場でNvidiaからシェアを獲得するため、 AIソフトウェアスタックROCm の成功に注力
- Nvidia CUDA の巨大な普及基盤が最大の障壁となる現状
- AMD VP AIソフトウェア のAnush Elangovanは「山を登るように、一歩一歩進む」と語る
- ElangovanはスタートアップNod.aiの買収でAMDに参加
- Nod.aiはAIコンパイラ分野で多数のオープンソースプロジェクトに貢献
ROCmの進化と開発体制
- 買収以降2年半にわたり ROCmへ継続的投資 を実施
- 当初は部品の寄せ集め状態だったが、現在は統一されたAIスタックへ進化
- Google Chrome開発チームの運用手法を手本に、 6週間ごとのリリース体制 を目指す
- ソフトウェア企業のようなスピード感と品質管理を実現
ポータビリティとオープンソース戦略
- OneROCm 構想により、AMDのCPU・GPU・FPGA間でAIスタックを統合
- すべてのアクセラレーションはROCmスタック経由で実行
- Triton や MLIR などオープンソース技術を活用し、クロスGPU対応を推進
- TritonカーネルによりAMD/Nvidia両GPUで同一コードの実行が可能
- Torch.MLIRで異なるハードウェアへのコード最適化を実現
- かつて主流だったCUDAからHIPへの変換は減少傾向
- 現在はvLLMやSGLangなどLLM推論フレームワークの最適化が主流
開発者コミュニティとの連携強化
- ROCmは100%オープンソース (ファームウェアを除く)で、コミュニティ主導のイノベーションを促進
- 開発者コミュニティへの積極的なアウトリーチ を展開
- Strix Halo搭載ノートPC対応で開発者の裾野拡大を狙う
- Windowsノート向けROCmアップデートもデータセンター向けと同時リリース
- Elangovan自身がX(旧Twitter)で「ROCm sucks」などのキーワードを監視し、直接的なサポートを実施
- GitHubでの苦情1,000件にも1年で全対応
- 迅速な対応がコミュニティの信頼獲得と利用拡大につながる
今後の展望と差別化
- 2026年後半に MI450 の出荷を予定し、さらなる性能向上を図る
- ROCmを「今後10年使える開発基盤」として進化させる方針
- 新ハードウェア登場時も心配不要なプラットフォーム設計
- CUDAと差別化できる独自機能の検討も本格化
まとめ
- ROCm はAI時代のオープンなGPUソフトウェア基盤として着実に進化
- AMD は開発者との対話とオープンソース戦略でNvidiaに挑戦
- 「一歩一歩」の着実な前進で、次世代AIエコシステムのリーダーを目指す