概要
GLM-4.5およびGLM-4.5-Airは、エージェント指向アプリケーション向けの最新フラッグシップ基盤モデル。 Mixture-of-Experts(MoE)アーキテクチャを採用し、パラメータ効率と推論能力を両立。 128kトークンの長いコンテキストと強力なツール呼び出し最適化を実現。 コーディング・推論・エージェントタスクに特化したファインチューニング。 Thinking Mode搭載で複雑な推論から即時応答まで柔軟に対応。
GLM-4.5/GLM-4.5-Airの全体像
- GLM-4.5 :総パラメータ数355B、1回の推論で32Bアクティブパラメータ
- GLM-4.5-Air :総パラメータ数106B、1回の推論で12Bアクティブパラメータ
- Mixture-of-Experts(MoE)構造 による高効率な計算
- 15兆トークン の一般ドメインデータで事前学習
- コード・推論・エージェントタスクに特化したデータセットでファインチューニング
- 128kトークン の長大なコンテキスト長
- 強化学習による推論・コーディング・エージェント性能の強化
- ツール呼び出し・Webブラウジング・ソフトウェア開発 に最適化
- Claude CodeやRoo Codeなどのコード中心エージェントへの統合実績
- Thinking Mode/Non-Thinking Mode の切り替えが可能
- thinking.typeパラメータで制御(enabled/disabled)
- デフォルトはダイナミックシンキング有効
GLM-4.5シリーズの能力・特徴
- AGI実現の第一歩 :推論・コーディング・エージェント能力の統合
- 代表的な12種ベンチマーク(MMLU Pro, AIME24, MATH 500, SciCode, ほか)で評価
- 世界第2位、国内・OSSモデルで第1位 の総合スコア
- 高いパラメータ効率 :DeepSeek-R1の半分、Kimi-K2の1/3のパラメータで上回る性能
- GLM-4.5-Air はGemini 2.5 FlashやClaude 4 Opusを推論ベンチマークで上回る
- SWE-Bench Verified などでパレート最前線の性能対パラメータ比
コスト・スピード・実運用性
- APIコスト :入力100万トークンあたり$0.2、出力100万トークンあたり$1.1
- 生成速度 :実測で毎秒100トークン超
- 低レイテンシー・高並列性 の運用が可能
- Claude Code等への組み込み検証 で高いツール呼び出し信頼性・タスク完遂率
- 52問の実タスクとエージェント軌跡を公開 し、再現性と透明性を担保
主要用途・コア能力
- コーディングスキル :インテリジェントなコード生成・リアルタイム補完・自動バグ修正
- 主要言語 (Python, JavaScript, Javaなど)に対応
- 自然言語指示に基づく高品質・拡張性のあるコード生成
- 現場開発ニーズ重視 :テンプレート的出力を回避
- ユースケース :1時間以内のリファクタリング、5分でプロトタイプ生成
Thinking Modeの使い分け
- thinking.typeパラメータ で「enabled(有効)」と「disabled(無効)」を切替
- デフォルトはダイナミックシンキング有効
- 簡単なタスク (事実取得・分類など):Thinking不要
- 中程度のタスク (比較・理由説明など):Thinking自動適用
- 難易度の高いタスク (数学・ネットワーク・複雑なコーディング):最大限の推論能力を発揮
APIサンプルコード
- 基本呼び出し例 (curl)
curl -X POST "https://api.z.ai/api/paas/v4/chat/completions" \ -H "Content-Type: application/json" \ -H "Authorization: Bearer your-api-key" \ -d '{ "model": "glm-4.5", "messages": [ { "role": "user", "content": "As a marketing expert, please create an attractive slogan for my product." }, { "role": "assistant", "content": "Sure, to craft a compelling slogan, please tell me more about your product." }, { "role": "user", "content": "Z.AI Open Platform" } ], "thinking": { "type": "enabled" }, "max_tokens": 4096, "temperature": 0.6 }' - ストリーミング呼び出し例
curl -X POST "https://api.z.ai/api/paas/v4/chat/completions" \ -H "Content-Type: application/json" \ -H "Authorization: Bearer your-api-key" \ -d '{ "model": "glm-4.5", "messages": [ { "role": "user", "content": "As a marketing expert, please create an attractive slogan for my product." }, { "role": "assistant", "content": "Sure, to craft a compelling slogan, please tell me more about your product." }, { "role": "user", "content": "Z.AI Open Platform" } ], "thinking": { "type": "enabled" }, "stream": true, "max_tokens": 4096, "temperature": 0.6 }'
参考リソース
- APIドキュメント :詳細なAPI利用方法
- クイックスタートガイド :素早い導入サポート
- 52問の実タスクデータ公開 :業界検証・再現性確保用