概要
- Composerは高速かつ高精度なソフトウェアエンジニアリング向けエージェントモデル
- 実際の大規模コードベース課題で訓練、既存モデルの4倍の生成速度を実現
- Mixture-of-Experts構造、長文コンテキストと多様なツール連携に対応
- RLによる専門性強化と効率的なツール活用
- Cursor Benchで現場開発者の実用性を評価
Composer: ソフトウェアエンジニアリング向け高速エージェントモデル
- Composer は、ソフトウェアエンジニアリング作業のために設計された 新しいエージェントモデル
- ベンチマークにて、同等モデル比で 4倍の生成速度 と最先端のコーディング性能
- 実際の 大規模コードベース課題 を用いた訓練プロセス
- 検索・編集ツール を統合し、難度の高い課題解決を効率的に実施
- Cursor Tab開発経験から、 インタラクティブな利用体験 を重視
開発動機と進化
- Cursor Tab開発時に、 開発者が求めるのは賢くかつ高速なモデル であることを認識
- 試作エージェントモデル「Cheetah」で 速度の重要性 を検証
- Composerは、その知見を反映した より賢く高速な後継モデル
技術的特徴
- Mixture-of-Experts(MoE)構造 を採用、長文コンテキスト生成・理解に最適化
- 強化学習(RL)により、多様な 開発環境への適応性 を獲得
- 各訓練ステップで、 課題記述への最適応答 (コード編集・計画・説明)を生成
- ファイル編集・検索・ターミナル操作 など多様なツールにアクセス可能
評価とベンチマーク
- Cursor Bench :実際のエージェントリクエストと最適解を用いた独自ベンチマーク
- モデルの 正確性だけでなく、既存コードベースの抽象化や開発慣習への準拠 も評価
- Cursor社内エンジニア・研究者の実際のリクエストを反映
強化学習による最適化
- ツール利用の効率化・並列化 を重視した報酬設計
- 不要な応答や根拠のない主張の抑制 を学習
- 複雑な検索・リンター修正・ユニットテストの自動実行 など有用な行動を自発的に習得
インフラとシステム
- PyTorchとRay を活用した非同期強化学習用カスタムインフラ
- MXFP8 MoEカーネル と専門家並列・ハイブリッドシャーディングによる低精度大規模学習
- NVIDIA GPU数千台規模 での効率的な訓練を実現
- MXFP8 により、後処理なしで高速推論が可能
ツール連携とサンドボックス
- Cursor Agent harness 内の全ツール呼び出しに対応
- コード編集・セマンティック検索・grep・ターミナル操作 など多機能
- 数十万同時サンドボックス環境 をクラウドで実現
- Background Agents 用インフラを拡張し、RL環境と本番環境を統合
Composerの社内利用と展望
- Cursorは自社開発ツールを 積極的に現場利用
- Composer開発の動機は「 自分たちが使いたいエージェント」の実現
- 社内エンジニアの 日常開発での活用実績
- 今後も 価値ある開発支援ツール としての進化を期待
ベンチマーク補足情報
- 内部ベンチマークで 各モデルクラスの最良モデル を比較
- 「Fast Frontier」には Haiku 4.5, Gemini Flash 2.5 など高速推論モデル
- 「Best Open」には Qwen Coder, GLM 4.6 など最新オープンウェイトモデル
- 「Frontier 7/2025」は 2025年7月時点の最良モデル
- 「Best Frontier」には GPT-5, Sonnet 4.5 (Composerより高性能)
- トークン毎秒は Anthropic最新トークナイザー基準で標準化