世界を動かす技術を、日本語で。

MiniMax-M1オープンウェイト大規模ハイブリッドアテンション推論モデル

概要

MiniMax-M1は、世界初のオープンウェイト大規模ハイブリッドアテンション推論モデル。 ハイブリッドMoEアーキテクチャとLightning Attentionを組み合わせ、高効率・長文処理に対応。 ベンチマークでDeepSeek R1やQwen3-235Bを上回る性能を発揮。 RLスケーリングやCISPOアルゴリズムを導入し、複雑なタスクに強み。 モデル配布・デプロイ・API利用・問い合わせ方法も提供。

MiniMax-M1 概要

  • MiniMax-M1 は世界初の オープンウェイト大規模ハイブリッドアテンション推論モデル
  • ハイブリッドMixture-of-Experts(MoE) アーキテクチャと Lightning Attention を採用
  • 前身のMiniMax-Text-01を基に開発、 総パラメータ4560億1トークンあたり45.9億パラメータ 活性化
  • 100万トークンのコンテキスト長 をネイティブでサポート(DeepSeek R1の8倍)
  • Lightning Attentionにより、 テスト時計算効率が大幅向上、例:DeepSeek R1比でFLOPs25%消費(10万トークン生成時)
  • 大規模強化学習(RL) で伝統的数学推論から実世界ソフトウェア開発まで幅広く学習
  • CISPOアルゴリズム (トークン更新でなく重要度サンプリング重みをクリップ)を提案、他RL手法より高性能
  • ハイブリッドアテンション設計 がRL効率を自然に向上、スケーリング時の課題も解決
  • 40K/80Kシンキングバジェット の2モデルを展開

ベンチマーク性能比較

  • 標準ベンチマークで DeepSeek R1やQwen3-235Bより高い性能 を発揮
    • ソフトウェア工学、ツール利用、長文タスク で特に強み
  • 主要モデル(MiniMax-M1-80K/40K, Qwen3-235B, DeepSeek R1, Claude 4, Gemini 2.5 Pro, OpenAI-o3等)と比較
  • 代表的なスコア(抜粋):
    • Mathematics(AIME 2024):MiniMax-M1-80K:86.0、DeepSeek R1:91.4
    • Coding(LiveCodeBench):MiniMax-M1-80K:65.0、DeepSeek R1:73.1
    • Long Context(OpenAI-MRCR 1M):MiniMax-M1-80K:56.2、Gemini 2.5 Pro:58.8
    • Tool Use(TAU-bench airline):MiniMax-M1-80K:62.0、Claude 4:59.6

SWE-bench評価手法

  • Agentless scaffold を用いた2段階ローカライゼーション(埋め込み検索なし)
    • 粗い粒度でファイル特定→細かい粒度でコード要素特定
  • n=486の検証済みタスクで評価(内部インフラ非対応の14ケース除外)

TAU-bench評価手法

  • GPT-4.1 をユーザーモデルとして利用、カスタムツール未使用
  • 最大40ステップまでの対話で評価
  • システムプロンプトにツール利用やポリシー厳守を明記

デプロイガイド

  • HuggingFace からモデルダウンロード可能
    • MiniMax-M1-40k
    • MiniMax-M1-80k
  • vLLM による本番運用を推奨
    • 高性能なサービス
    • 効率的なメモリ管理
    • 強力なバッチリクエスト処理
    • 最適化されたパフォーマンス
  • vLLMデプロイ詳細は vLLM Deployment Guide 参照
  • Transformers による直接デプロイも可能(詳細はMiniMax-M1 Transformers Deployment Guide参照)

ファンクションコーリング

  • 外部関数呼び出し機能 をサポート
    • 必要時に関数呼び出しを自動判別し、パラメータを構造化出力
  • 詳細手順は MiniMax-M1 Function Call Guide 参照

チャットボット・API

  • 一般利用・評価向けに チャットボット(オンライン検索対応)API を提供
  • MiniMax MCP Server で動画生成・画像生成・音声合成・ボイスクローン機能も用意

お問い合わせ

  • model@minimax.io までメールで連絡可能

Hackerたちの意見

  1. どうやらMiniMaxの「ローンチウィーク」らしいね。月曜日にM1を発表して、火曜日にはHailuo 2を出したみたい。今週の残りもこのペースでモデルをリリースできるかはまだわからないけど、この2つは大きなもので、今のところllmとビデオモデル以外ではあまり知られてないみたい。発表があるかどうかは、https://x.com/MiniMax__AIをチェックしてみて。 2. minimax m1の技術レポートは読む価値あるよ: https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M... 彼らがSOTAのオープンウェイトモデルではないかもしれないけど、ライトニングアテンションやGRPOバリアント(CISPO)についてはかなり大きな主張をしてる。俺は関係者じゃないけど、ここでまだコメントがないから、今まで学んだことをシェアしてるだけ。

ちょっと思ったこと:* LinkedInによると、シンガポールに拠点を置く会社みたい。すごく良いLLMを作るのに、あまり障壁はなさそう。* オープンウェイトモデルとStrix Halo / Ryzen AI Maxの開発のおかげで、数年後にはローカルで素晴らしいLLMを動かすのが比較的安くなるんじゃないかと期待してる。

LinkedInによると、シンガポールに拠点を置く会社 Nah、これは上海に拠点を置く会社だよ。

ローカルでモデルを動かすのが避けられない流れになってきてる気がする。ワクワクするし、ちょっと心配でもある。もしこの分野について尊敬している人のアイデアや考えがあったら、もっと聞きたいな。

彼らはシンガポールじゃなくて、上海に拠点を置く中国の会社なんだ。香港のHKEXでIPOする予定もあるみたいだよ。 https://www.scmp.com/tech/tech-trends/article/3314819/deepse...

その関連のツイートによると、これに約50万ドルかけてトレーニングしたみたい。どうやってやったんだろう? > 「比類のない効率でRL:534,700ドルでトレーニングされた」 0: https://x.com/MiniMax__AI/status/1934637031193514237

「このhttpsのURLでMiniMax-M1を公開します」とarxivの論文に書いてあって、空のリポジトリへのリンクじゃないんだ!もうこの人たちが好きになっちゃった。

公式ページにはどこにも書いてないけど、これは中国の会社だよ。 https://en.wikipedia.org/wiki/MiniMax_(company)

なんでプロジェクトのページでそんなことを言うと思ったの?

どうやらIPOのために話題を作ってるみたいだね。 https://www.bloomberg.com/news/articles/2025-06-18/alibaba-b...

もっといいモデル名考えてよ。これ、俺のMac Studioのプロセッサーみたいじゃん。

https://en.wikipedia.org/wiki/Minimax 彼らはクラシックなAIアルゴリズムから名前を取ったんだね。

それに、俺の昔飼ってた犬の名前がマックスだったけど、すごく小さかったんだ。ほんとにひどい名前だよ、犯罪ギリギリだと思う。

あなたのMacは「Apple」が作ってて、文字通りリンゴの品種から名前を取ってるんだよ。

これを動かすには、8x H200 141GBが必要で、値段は$250kだよ。 1. https://github.com/MiniMax-AI/MiniMax-M1/issues/2#issuecomme... 2. https://www.ebay.com/itm/335830302628

それがフル量子化だね。Q4やQ8で動かせば、1万ドル以下の機材でもいけるよ。

もし彼らが西洋のクラウドインフラなしでこの規模をトレーニングしたなら、トークンのスループット設定がどうなってるのか知りたいな。