概要
- VibeThinker-3B は3Bパラメータの小型モデルで、検証可能な推論能力を追求
- Spectrum-to-Signal 手法を基盤に最適化パイプラインを導入
- 複数のベンチマークで 最先端レベルの性能 を達成
- 大規模モデル と同等またはそれ以上の推論能力を示す
- パラメトリック圧縮カバレッジ仮説を提唱
VibeThinker-3B:小型モデルによる検証可能な推論の限界追求
- VibeThinker-3B は、3B(30億)パラメータの 密集型コンパクトモデル
- 小型モデル領域で、 検証可能な推論能力 の限界を調査
- Spectrum-to-Signal ポストトレーニング手法を基盤に構築
- カリキュラムベースの教師ありファインチューニング、 マルチドメイン強化学習、 オフライン自己蒸留 による最適化パイプライン
- AIME26スコア94.3 (テスト時スケーリングで97.1)、 LiveCodeBench v6 Pass@1で80.2、 LeetCode未公開コンテストで96.1%受理率
- DeepSeek V3.2、 GLM-5、 Gemini 3 Pro など大規模モデルと同等以上の性能帯
- IFEvalスコア93.4 で厳格な命令制御性も維持
- 先行の 1.5Bモデル研究 を拡張
パラメトリック圧縮カバレッジ仮説
- 検証可能な推論 は、 コンパクトな推論コア へ圧縮可能との仮説
- オープンドメイン知識 や 汎用的な能力 には、事実・概念・ロングテール事例をカバーする広範なパラメータが必要
- 小型モデルは単なる デプロイ効率型代替 ではなく、 フロンティア級性能 への補完的アプローチ
- パラメータ密度と性能の関係性 に新たな視点を提供
- モデル開発戦略の多様化と効率的な推論システム実現への示唆