概要
- Sweep Next-Edit は、次のコード編集を予測する 1.5Bパラメータモデル
- Q8_0 GGUF形式 で量子化され、 ローカルPC で高速動作
- 4倍以上大きい他モデル よりも高精度・高速度を実現
- JetBrainsプラグイン や Hugging Face で利用可能
- オープンソース で、幅広いエディタへの組み込みが可能
Sweep Next-Edit 1.5B モデル概要
- 次のコード編集予測 を目的とした生成AIモデル
- 1.5B(15億)パラメータ による高精度な予測
- Q8_0 GGUF形式 で量子化、軽量化実現
- コンテキスト長8192トークン 対応
- Qwen2.5-Coder をベースとしたモデル設計
- 500ms未満 の応答速度(スペキュレイティブデコーディング利用)
- ローカル実行 可能、プライバシー保護に配慮
- Apache 2.0ライセンス でオープンソース提供
主な特徴と利点
- 最近の編集履歴 をコンテキストに含める次編集予測型オートコンプリート
- Cursor のような体験を JetBrainsプラグイン や VSCode/Neovim 等で実現可能
- Mercury (Inception)、 Zeta (Zed)、 Instinct (Continue) 等の競合モデルよりも高精度
- 5種類のベンチマーク (カーソル上下予測、遠距離ジャンプ、標準FIM、ノイズ耐性等)で検証
- 正確な一致率 が実用性指標として最も相関が高い
- プロンプト形式 の工夫により、小型モデルでも理解しやすい構成
- original/updatedブロック形式が最適解
- SFT(教師あり微調整) :パーミッシブライセンスのOSSリポジトリ約10万例を4時間/8xH100で学習
- RL(強化学習) :tree-sitterによる構文チェックとサイズ正則化で2000ステップ微調整
- SFTだけでは困難なエッジケース(パース不可や冗長出力)を改善
利用方法
- run_model.py およびモデルファイルをダウンロード
- llama-cpp-python と huggingface_hub をインストール
- コマンド例:
uv pip install llama-cpp-python huggingface_hubpython run_model.py
- run_model.py にて具体的なプロンプト例・利用方法を記載
導入・連携先
- JetBrains用Sweep AIプラグイン で即利用可能
- Hugging Face (https://huggingface.co/sweepai/sweep-next-edit-1.5b)でモデル配布
- VSCode/Neovim 等、他エディタでの組み込みも推奨
コミュニティへの呼びかけ
- オープンソースウェイト公開 により、誰でも高速・プライバシー配慮型オートコンプリートの構築が可能
- VSCodeやNeovim等 のエディタ向け実装例も歓迎
- 技術ブログ や ベンチマーク詳細 も公開中
関連リンク
- 技術ブログ :詳細・ベンチマーク解説
- JetBrainsプラグイン :Sweep AI JetBrains Plugin
- Hugging Faceモデルページ :https://huggingface.co/sweepai/sweep-next-edit-1.5b
- プラグイン配布ページ :https://plugins.jetbrains.com/plugin/26860-sweep-ai-autocomp
まとめ
- Sweep Next-Edit は、軽量・高速・高精度な次編集予測モデル
- ローカル動作 ・ オープンソース で、幅広い用途・エディタに対応可能
- 開発者コミュニティ による新たな活用事例やフィードバックを歓迎