概要
- 2026年4月、DeepSeekがV4シリーズのAIモデルを発表
- DeepSeek-V4-Proはオープンウェイト最大規模のモデル
- FlashとProの2種類、いずれも高効率・低コスト
- 価格は競合他社を大きく下回る水準
- 長文コンテキストや効率性に特化した設計
DeepSeek V4シリーズ新モデル発表
- DeepSeek は2026年4月に V4シリーズ をリリース
- 今回発表されたのは DeepSeek-V4-Pro と DeepSeek-V4-Flash の2モデル
- 両モデルとも 1Mトークンのコンテキスト長 を持つ Mixture of Expertsアーキテクチャ 採用
- Proモデル は 総パラメータ1.6兆、アクティブ49B Flashモデル は 総パラメータ284B、アクティブ13B
- MITライセンス で公開、商用利用も可能
モデル規模・比較
- DeepSeek-V4-Pro は現時点で 最大規模のオープンウェイトモデル
- これまでの Kimi K2.6(1.1T) や GLM-5.1(754B) を上回る規模
- 前世代の DeepSeek V3.2(685B) の2倍以上
- Hugging Face で配布:Proは 865GB、Flashは 160GB
ローカル実行・互換性
- Flashモデル は 128GBメモリのMacBook Pro でも量子化すれば動作可能性
- Proモデル は必要なエキスパートのみディスクからストリーミングすれば実行可能性
- OpenRouter 経由でモデルを試用可能
- コマンド例:
llm install llm-openrouter llm openrouter refresh llm -m openrouter/deepseek/deepseek-v4-pro 'Generate an SVG of a pelican riding a bicycle'
- コマンド例:
価格・コスト比較
-
DeepSeek V4 Flash 入力$0.14/100万トークン、出力$0.28/100万トークン
-
DeepSeek V4 Pro 入力$1.74/100万トークン、出力$3.48/100万トークン
-
競合モデルとの比較表
| モデル | 入力($/M) | 出力($/M) | |-------------------------|-----------|-----------| | DeepSeek V4 Flash | 0.14 | 0.28 | | GPT-5.4 Nano | 0.20 | 1.25 | | Gemini 3.1 Flash-Lite | 0.25 | 1.50 | | Gemini 3 Flash Preview | 0.50 | 3.00 | | GPT-5.4 Mini | 0.75 | 4.50 | | Claude Haiku 4.5 | 1.00 | 5.00 | | DeepSeek V4 Pro | 1.74 | 3.48 | | Gemini 3.1 Pro | 2.00 | 12.00 | | GPT-5.4 | 2.50 | 15.00 | | Claude Sonnet 4.6 | 3.00 | 15.00 | | Claude Opus 4.7 | 5.00 | 25.00 | | GPT-5.5 | 5.00 | 30.00 |
- Flash は小型モデルで最安、 Pro も大規模モデルで最安
効率性とアーキテクチャの特徴
- 1Mトークンコンテキスト においても高効率
- Proモデル :DeepSeek V3.2比で FLOPs27%・KVキャッシュ10%
- Flashモデル :同じく FLOPs10%・KVキャッシュ7%
- 効率化設計 により低コストを実現
性能・ベンチマーク
- DeepSeek論文内ベンチマークで Proモデルはフロンティアモデルと競合
- GPT-5.2やGemini-3.0-Pro よりも高性能
- GPT-5.4やGemini-3.1-Pro にはやや劣る(約3~6ヶ月の開発差)
今後の展望・量子化モデル
- Unslothチーム による量子化版モデルの公開が期待
- Flashモデル がローカルマシンでどこまで動作するかに注目