概要
- Kimi K2 は最先端の Mixture-of-Experts (MoE) 言語モデル
- 1兆パラメータ と 32B有効パラメータ を持つ大規模モデル
- Muon最適化手法 を用いた高安定性・高性能
- エージェント的推論・ツール利用 に強み
- APIや推論エンジンでの 導入・利用方法 も公開
Kimi K2: 次世代MoE言語モデルの紹介
- Kimi K2 は 最先端のMixture-of-Experts (MoE) アーキテクチャ採用
- 総パラメータ1兆・有効パラメータ32B の大規模モデル
- MuonClip Optimizer によるスケール時の安定性確保
- エージェント的知能 (ツール利用・自律的問題解決)に特化
- Kimi-K2-Base と Kimi-K2-Instruct の2バリアントを提供
- Kimi-K2-Base:研究者・開発者向け基盤モデル
- Kimi-K2-Instruct:即利用可能な汎用・エージェント体験向け
モデルの概要・アーキテクチャ
- アーキテクチャ :Mixture-of-Experts (MoE)
- 総パラメータ数 :1兆(1T)
- 有効パラメータ数 :32B
- 層数 :61(うちDense Layer 1層)
- Attention Hidden Dimension :7168
- MoE Hidden Dimension(各Expert) :2048
- Attention Head数 :64
- Expert数 :384
- トークンごとに選択されるExpert数 :8
- 共有Expert数 :1
- 語彙数 :160K
- コンテキスト長 :128K
- Attention機構 :MLA
- 活性化関数 :SwiGLU
ベンチマーク評価結果(Kimi-K2-Instruct)
- コーディングタスク で高いPass@1スコア(例:LiveCodeBench 53.7, SWE-bench Verified 65.8)
- ツール利用タスク で強力な性能(Tau2 retail 70.6, AceBench 76.5 など)
- 数学・STEMタスク で最先端水準(MATH-500 97.4, AIME 2024 69.6 など)
- 一般タスク でも高精度(MMLU 89.5, MMLU-Redux 92.7 など)
- 一部指標で世界SOTA・OSS SOTAを達成
- 詳細なベンチマーク比較 は表を参照
ベースモデル評価結果(Kimi-K2-Base)
- MMLU-Redux-2.0 等で高精度(90.2)、他OSSモデルと比較し優位性
- SimpleQA, TriviaQA など幅広いタスクで高スコア
- コーディング・数学・中国語タスク でも高水準
デプロイと利用方法
- API提供 : https://platform.moonshot.ai でOpenAI/Anthropic互換API
- Anthropic互換APIは温度パラメータ調整(request_temperature * 0.6)
- モデルチェックポイント :block-fp8形式でHuggingfaceに公開
- 推奨推論エンジン :vLLM、SGLang、KTransformers、TensorRT-LLM
- デプロイ例 はModel Deployment Guide参照
モデル利用例
- チャット補完 :OpenAI互換APIで簡単にチャット可能
- 推奨温度:0.6
- デフォルトのsystemプロンプト例を提供
- ツール呼び出し :Kimi-K2-Instructは強力なツールコール機能
- ツールリストを渡すことで自律的にツール実行
- サンプルコードでエンドツーエンドのツール呼び出し手順を解説
- 推論エンジンがKimi-K2のネイティブツール解析ロジックをサポートしている必要あり
ライセンス・問い合わせ
- Modified MIT License でコード・モデル重みを公開
- 問い合わせ先 :support@moonshot.cn
Kimi K2 は大規模・高性能なMoE言語モデルであり、 研究・開発・実運用 の幅広いシーンで活用可能。 OSSモデルの中でもトップクラスの性能 を持ち、 APIや推論エンジン連携 も充実。エージェント的な知能やツール利用が求められる現場で特に有効。