概要
Mercury は、 Inception Labs による次世代の商用スケール大規模言語モデル(LLM) Diffusion ベースの手法と Transformer アーキテクチャを組み合わせた設計 Mercury Coder Mini/Small は、コード生成用途に特化し、速度と品質で最先端を実現 NVIDIA H100 上で既存モデルの最大10倍のスループットと同等品質を達成 Copilot Arena での実証と、API・無料プレイグラウンドの公開
Mercury: Diffusionベースの新世代LLM
- Mercury は、 Diffusion手法 を採用した商用規模の大規模言語モデル
- モデルのパラメータ化には Transformerアーキテクチャ を利用
- 複数トークンの同時予測による高速な生成性能
- コード生成用途に特化した Mercury Coder シリーズの展開
- モデルサイズは Mini と Small の2種類を提供
Mercury Coderの特徴と性能
- Artificial Analysis による第三者評価の実施
- Mercury Coder Mini は 1109 tokens/sec、 Small は 737 tokens/sec のスループットを記録
- NVIDIA H100 GPU 上で、速度最適化済みの既存最先端モデルを平均10倍上回る性能
- 品質面では既存モデルと同等水準を維持
- 多言語・多用途のコードベンチマークで高いパフォーマンスを実証
実世界での検証と公開リソース
- Copilot Arena において、品質で2位、速度では最速モデルとして認定
- 開発者によるリアルワールド評価を通じた信頼性の確保
- パブリックAPI および 無料プレイグラウンド を一般公開
- 論文・評価データは arXiv にて公開、DOI取得予定
- コアメンバーは Inception Labs を中心とした多国籍研究者チーム
研究のインパクトと今後の展望
- Diffusion×Transformer の組み合わせによるLLMの新たな可能性
- 商用・開発現場での即時活用が可能な高効率モデル
- 継続的な品質向上と多用途展開への期待
- コード生成以外の応用範囲拡大への布石
- 研究コミュニティへのオープンな貢献姿勢