概要
- Ai2 Open Coding Agents は、オープンかつ低コストで強力なコーディングエージェントを構築可能にする新手法とモデル群の公開
- SERA (Soft-verified Efficient Repository Agents)を中心に、プライベートなコードベースにも迅速・安価に適応可能
- 合成データ生成 や新しいトレーニング手法による効率化と高性能化を実現
- ハードウェア要件の緩和 と再現性の高いパイプラインで、研究者や開発者の参入障壁を大幅に低減
- 完全オープンなリリース で、モデル・コード・データ・レシピを全公開
コーディングエージェントの進化と課題
- 過去1年で コーディングエージェント は、ソフトウェア開発の方法を大きく変革
- デバッグ、リファクタリング、Pull Requestの自動化などの実現
- 既存の多くは クローズド・高コスト・適応困難 という制約
- プライベートなコードベースに適応するには 合成データ生成 が必須だが、従来は高コストかつ困難
- Ai2 Open Coding Agents は、これらの課題を解決するために開発
SERAとその特徴
- SERA は、オープンソースのコーディングエージェントモデル群の最初のリリース
- SERA-32B は、SWE-Bench Verified問題の54.2%を解決し、同規模の従来オープンモデルを上回る性能
- 40 GPU日以内で訓練可能(NVIDIA Hopper/RTX PRO 6000 Blackwell対応)
- Claude Code との互換性や、NVIDIAとの協業による推論最適化
- 4xH100 GPUでBF16精度時1,950トークン/秒、FP8精度時3,700トークン/秒
- Blackwell 4xB200 NVFP4時8,600トークン/秒
- 全コンポーネントがオープン で、ワンラインで立ち上げ可能な手軽さ
合成データ生成と効率化の革新
- Soft-verified generation (SVG)
- 完全な正解でなくても有用な合成パッチを生成し、インフラコストを大幅削減
- バグタイプメニュー
- 51種のバグパターンから多様なバグプロンプトを生成し、データ多様性を確保
- 開発者ワークフロー再現性
- コードの正確性よりも、開発者の実際の作業プロセスを模したデータ生成を重視
- SFT(Supervised Fine-Tuning)だけで高性能
- 複雑なRLパイプライン不要で、シンプルな教師あり学習でモデルを強化
性能とコストの両立
- 8B~32Bパラメータの Qwen3ベース モデル群
- SWE-Bench Verifiedで SERA-32B は49.5% ±1.9%(32Kコンテキスト)、54.2% ±1.4%(64Kコンテキスト)
- Devstral Small 2やGLM-4.5-Airと同等の水準
- 専門化による大規模モデル超え
- DjangoやSymPyなどのリポジトリで、32Bモデルが100B+の教師モデルを上回る性能
- 小型モデルでもメモリ・推論コストが低く、高速動作
再現性・導入容易性・コミュニティへの貢献
- モデル・コード・データ・レシピ全公開
- 2行で推論サーバー立ち上げ、Claude Code連携も簡単
- 再現コストの大幅削減
- 最高性能のオープンモデル再現が約$400、業界最高水準でも$12,000
- ローカル・クラウド・独自データへのファインチューニングが容易
- 研究・開発の民主化と、コミュニティ主導の進化促進
まとめ:SERAがもたらす新しいコーディングエージェントの世界
- 低コスト・オープン・高性能 なコーディングエージェントの普及
- プライベートコードベースへの簡単な適応 と、研究・産業界双方での活用促進
- コミュニティ主導の検証・発展 が可能な新たな基盤の提供