ハクソク

世界を動かす技術を、日本語で。

HuaweiがHuawei Ascend GPUでトレーニングされたオープンウェイトモデルを発表

2025年7月2日原文(arxiv.org)

概要

Mixture of Grouped Experts (MoGE) は、従来のMoEの課題である専門家の負荷不均衡を解消する新アーキテクチャ。
Pangu Pro MoE は、MoGEを採用し、Ascend NPU上で高効率な分散推論を実現。
トークンごとに均等に専門家を活性化し、 デバイス間の計算負荷を最適化。
既存の32B/72B密モデルよりも 高い推論性能とコストパフォーマンス を達成。
GLM-Z1-32BやQwen3-32B などの有力オープンソースモデルを上回る性能を実証。

Mixture of Grouped Experts (MoGE)の概要

MoGE は、専門家（Expert）をグループ化し、トークンごとに各グループから均等に専門家を選択する設計。
従来の MoE では、一部の専門家に負荷が集中しやすい問題を抱える。
グループごとの均等活性化により、 計算負荷のバランス を自動的に調整。
複数デバイスでの並列実行時、 デバイス間の負荷分散 を実現。
特に推論フェーズでの スループット向上 と効率的なリソース活用が可能。

Pangu Pro MoEの特徴と性能

Pangu Pro MoE は、MoGEアーキテクチャを採用した 72Bパラメータ のスパースモデル。
各トークンで 16Bパラメータ のみ活性化し、計算コストを大幅削減。
Ascend 300I Duo/800I A2 向けにシステムシミュレーションを通じて最適化。
推論性能 は1カードあたり1148 tokens/s、推測的アクセラレーションで1528 tokens/sを達成。
同規模の Denseモデル（32B/72B） よりも高効率。

Ascend NPUにおけるMoGEの分散学習と推論

Ascend NPU による大規模並列実行で、モデル学習と推論の効率化。
MoGEにより、 専門家ごとの負荷均等化 が実現し、デバイス利用率の最大化。
コストパフォーマンス に優れ、実運用に適した推論環境を提供。
Pangu Pro MoE は、サブ100Bパラメータクラスで最高レベルの性能を持つモデル。
GLM-Z1-32BやQwen3-32B といった著名なオープンソースモデルを上回る結果を報告。

今後の展望と応用可能性

MoGE の導入により、今後さらに大規模なLLMの効率的な運用が期待。
分散環境 での負荷分散技術として、他のAIモデルやプラットフォームへの応用可能性。
Pangu Pro MoE の成果は、産業応用や研究開発における大規模言語モデルの新たな標準となる可能性。

Hackerたちの意見

重みはgitcodeで入手可能だよ。[1]: https://gitcode.com/ascend-tribe/pangu-pro-moe-model

└

一応警告だけど、ライセンス[1]はEUでの使用を明確に禁止してるよ。 > 「ライセンス付与の条件。あなたは、EU内でモデルにアクセス、ダウンロード、インストール、実行、展開、統合、変更、またはその他の方法で使用しないことを表明し、保証します。」[1] https://gitcode.com/ascend-tribe/pangu-pro-moe-model/blob/ma...

└

オープンソースが使われるときに、オープンウェイトの方が正しいって言って怒る人もいるよね（ここではオープンウェイトが特に適用されてるから嬉しいけど）。で、オープンウェイトって本当に面白いの？何を提供してくれるの？モデルのバイアス（あるいはその逆）を覗くことができるの？競合モデルを訓練することができるの？オープンソースは別の何かで好ましいものになるのか、それとも「ウェイトが新しいソース」っていうのが今のLLMの世界なのかな？自分を教育しようとしてるんだ。

世界は、Huaweiと中国がTSMCやNvidiaと競争できるようにノードサイズを縮小する必要がある。

└

地政学的な懸念を無視すれば、それは素晴らしいことだね。でも、AI技術は二面性があって、消費者市場での競争は軍拡競争に反映されるだろうし、今の中国の製造能力や安い労働力を考えると、中国が勝つ可能性が高い。とにかく、まずASMLを複製する必要があるけど、これは近い将来には実現しそうにないね。

└

アメリカがチップの輸出管理を撤廃したら、中国政府は逆に輸入管理を強化するんじゃないかな。NvidiaやTSMC、Apple、Googleに対抗する本物の競争相手を作る方が、彼らにとっては利益が大きいと思う。

Sic transit gloria nvidii

└

言語的な深い知識： "invidia"はラテン語で「嫉妬」を意味する。

└

ちょっと細かいこと言ってごめんね。Gen Sgはnvidiaeになると思うんだけど、iはoの変化形だから。

└

5年間のラテン語の勉強がやっと役に立った！

└

今日読んだ中で一番良いこと書いてあった。ブラボー！

└

Sic transit gloria nvidiae

Hacker Newsで議論の続きを見る