ステップ3.5 フラッシュ – オープンソースの基盤モデル、高速で深い推論をサポート

概要

総パラメータ数196B で、実際に活性化するのは 11Bパラメータ/トークン のMoEアーキテクチャ
推論・コーディング・エージェントタスク で高いスコアを記録
- 推論：97.3（PaCoRe時99.9）
- コーディング：74.4
- SWE-bench Verified：74.4%
- Terminal-Bench 2.0：51.0%
3-way Multi-Token Prediction（MTP-3） により、 100～300トークン/秒 の生成速度を実現
256Kコンテキストウィンドウ をサポートし、 3:1 Sliding Window Attention（SWA） で計算コストを抑制
ローカル展開可能、Mac Studio M4 MaxやNVIDIA DGX Spark等の高性能コンシューマー機器で動作

GLM-4.7 （355B）、 DeepSeek V3.2 （671B）、 Kimi K2.5 （1T）などの大規模モデルと同等以上のスコア
Gemini 3.0 Pro、 Claude Opus 4.5、 GPT-5.2 xhigh といったプロプライエタリモデルとも競合
平均スコア （8ベンチマーク平均）：Step 3.5 Flash（81.0）、GLM-4.7（78.5）、DeepSeek V3.2（77.3）、Kimi K2.5（80.5）、Gemini 3.0 Pro（80.7）、Claude Opus 4.5（80.6）、GPT-5.2 xhigh（82.2）

ツール連携能力 が特徴で、80以上のMCPツールを統合し株式投資分析を自動化
- 市場データ集約、テクニカル指標計算、カスタムメトリクス生成、クラウド連携による通知・保存を一括管理
Pythonコード実行 をChain-of-Thought推論に統合し、AIME 2025（99.8）、HMMT 2025 Nov.（98.0）等の論理・数学系ベンチマークで高得点
Tactical Weather Intelligence Dashboard ：WebGL 2.0によるリアルタイム3D気象可視化
Three.js Procedural Ocean Engine ：高精度CGレンダリング、PBR・フラクタル波形・レイトレーシング
Agentic Workflow Take In ：日常データ処理業務の自動化、ワークフロー生成・検証・変換・レポート出力
Epic Solar System Simulation ：3Dインタラクティブな太陽系シミュレーション
Autonomous Business Intelligence Engine ：CSV解析から多シナリオ予測、エラー訂正、データ可視化まで一貫処理
Autonomous Large-Scale Repository Architect ：大規模コードベースの依存関係解析・Wiki自動生成
Beyond Vibe Coding ：Claude Code等の先進エージェントフレームワークでの自律的問題解決力