概要
LFM2.5-8B-A1B は、消費者向けハードウェアで高速かつ信頼性の高いツール呼び出しを実現するエッジAIモデル。 128Kコンテキストウィンドウ や語彙数の倍増など、前モデルから大幅に強化。 推論速度と圧縮効率 で同クラス最速を達成し、多言語対応も向上。 オンデバイスAIアシスタント やエージェント用途に最適化。 Hugging Face や Playground で即日利用可能。
LFM2.5-8B-A1B:パーソナルアシスタントがあなたのラップトップに
- LFM2.5-8B-A1B は、 Liquid AI が開発したエッジAIモデル
- LFM2-8B-A1B (2025年10月リリース)から大幅進化
- 128Kトークン まで拡張したコンテキストウィンドウ
- 事前学習データ を12T→38Tトークンへ増強
- 語彙数 を65,536→128,000へ倍増、非ラテン文字の効率向上
- 大規模強化学習 による性能向上
- 推論速度・圧縮性能 が同クラス最高
- MoE(Mixture of Experts)、 GQA、 ゲート付き短畳み込みブロック の組み合わせ
- 推論専用モデル として設計、明示的な思考プロセスを経て回答生成
- Hugging Face および Playground で Base / Post-trained モデルを公開
主な特徴
- オンデバイスAIアシスタント :ツールチェーン、複雑な指示への対応、全デバイスで動作
- 圧縮性能 :大規模密度モデルやMoEモデルと競合
- 圧倒的なスループット :CPU・GPUで同サイズ帯最速、llama.cpp/MLX/vLLM/SGLang対応
- 低消費リソース :エントリーラップトップでも快適動作
前バージョンからの主な変更点
- コンテキストウィンドウ :32,768→128,000トークンまで拡張
- 語彙数 :65,536→128,000トークンへ増強
- ヒンディー語、タイ語、ベトナム語、インドネシア語、アラビア語 などで圧縮効率が大幅向上
- 推論専用設計 :思考チェーンを明示的に出力、MoE構造の特性を活かした高速推論
- 品質向上 :大規模事前学習+推論設計でベンチマーク性能大幅向上
トレーニングとトークナイザーの改善
- 語彙拡張 :既存トークナイザーを拡張し、128K語彙に対応
- BPEマージ を多言語コーパスで継続学習
- 新規トークンはサブトークンの平均で初期化
- 埋め込みのみ学習→全体継続学習の2段階適応
- 1トークンあたりの文字数 が全16言語で向上
- 例: ヒンディー語+120%、 タイ語+238%、 ベトナム語+117%
- コンテキスト拡張 :32K→128Kトークンに段階的拡張
- RoPE base θ 拡大+400Bトークンの長文データ追加学習
- ループ抑制 :長い推論での「無限ループ」発生を低減
- ループ誘発トークンの確率分布を調整
- RL(強化学習)でループ語の使用を抑制
- ハルシネーション対策 :知識限界超過時の「知らない」と明確に表現
- avg@k報酬によるRLで信頼境界を明確化
ベンチマーク結果
- AA-Omniscience Index や IFEval など主要ベンチマークで大幅な性能向上
- 同等パラメータ帯の密度モデルや大規模MoE と比較し、指示追従・エージェントタスクで競合
- 非ハルシネーション率 が飛躍的に向上(7.46→63.47%)
- 数学・エージェントワークフロー でも高い競争力
- Tau² Telecom などエージェント系ベンチマークで特に強み
主要比較モデル一覧
- Granite-4.0-H-Tiny
- Qwen3.5-4B
- Gemma-4-E2B-IT など
推論エコシステムとデバイス対応
- LEAP :iOS/Android向けエッジAIプラットフォーム
- llama.cpp :エッジ推論用GGUFチェックポイント
- MLX :Apple Silicon最適化
- vLLM/SGLang :GPU高速推論
- ONNX :多様なアクセラレータ対応
- CPU推論 :M5 Maxで253トークン/秒、Ryzen AI Max+ 395で146トークン/秒、スマホでも約30トークン/秒
- GPU推論 :Nvidia H100 SXM5で18.5Kトークン/秒(高同時実行時)
デモ:Local Cowork
- LocalCowork デスクトップエージェントでLFM2.5-8B-A1Bを動作確認
- 1台のラップトップ+13 MCPサーバー+67ツール
- クラウド・APIキー不要、完全オンデバイス
- ツール選択の高速化・信頼性向上
- 全処理が1秒未満で完了、データは外部送信なし
利用開始・今後の展望
- オープンウェイト :ダウンロード・ファインチューニング・デプロイ自由
- 即日高速推論 :Apple/AMD/Intel/Qualcomm/Nvidia各社ハードウェア対応
- 多様なバリエーション :ベースモデルから音声・画像特化型までカバー
- オンデバイスAIエージェント時代 の第一歩
引用情報
- Liquid AI, “LFM2.5-8B-A1B: Personal Assistant On Your Laptop,” Liquid AI Blog, May 2026.
- https://www.liquid.ai/blog/lfm2-5-8b-a1b