世界を動かす技術を、日本語で。

DeepSeek V4 - ほぼ最前線、価格はごくわずか

概要

  • 2026年4月、DeepSeekがV4シリーズのAIモデルを発表
  • DeepSeek-V4-Proはオープンウェイト最大規模のモデル
  • FlashとProの2種類、いずれも高効率・低コスト
  • 価格は競合他社を大きく下回る水準
  • 長文コンテキストや効率性に特化した設計

DeepSeek V4シリーズ新モデル発表

  • DeepSeek は2026年4月に V4シリーズ をリリース
  • 今回発表されたのは DeepSeek-V4-ProDeepSeek-V4-Flash の2モデル
  • 両モデルとも 1Mトークンのコンテキスト長 を持つ Mixture of Expertsアーキテクチャ 採用
  • Proモデル総パラメータ1.6兆、アクティブ49B Flashモデル総パラメータ284B、アクティブ13B
  • MITライセンス で公開、商用利用も可能

モデル規模・比較

  • DeepSeek-V4-Pro は現時点で 最大規模のオープンウェイトモデル
  • これまでの Kimi K2.6(1.1T)GLM-5.1(754B) を上回る規模
  • 前世代の DeepSeek V3.2(685B) の2倍以上
  • Hugging Face で配布:Proは 865GB、Flashは 160GB

ローカル実行・互換性

  • Flashモデル128GBメモリのMacBook Pro でも量子化すれば動作可能性
  • Proモデル は必要なエキスパートのみディスクからストリーミングすれば実行可能性
  • OpenRouter 経由でモデルを試用可能
    • コマンド例:
      llm install llm-openrouter
      llm openrouter refresh
      llm -m openrouter/deepseek/deepseek-v4-pro 'Generate an SVG of a pelican riding a bicycle'
      

価格・コスト比較

  • DeepSeek V4 Flash 入力$0.14/100万トークン、出力$0.28/100万トークン

  • DeepSeek V4 Pro 入力$1.74/100万トークン、出力$3.48/100万トークン

  • 競合モデルとの比較表

    | モデル | 入力($/M) | 出力($/M) | |-------------------------|-----------|-----------| | DeepSeek V4 Flash | 0.14 | 0.28 | | GPT-5.4 Nano | 0.20 | 1.25 | | Gemini 3.1 Flash-Lite | 0.25 | 1.50 | | Gemini 3 Flash Preview | 0.50 | 3.00 | | GPT-5.4 Mini | 0.75 | 4.50 | | Claude Haiku 4.5 | 1.00 | 5.00 | | DeepSeek V4 Pro | 1.74 | 3.48 | | Gemini 3.1 Pro | 2.00 | 12.00 | | GPT-5.4 | 2.50 | 15.00 | | Claude Sonnet 4.6 | 3.00 | 15.00 | | Claude Opus 4.7 | 5.00 | 25.00 | | GPT-5.5 | 5.00 | 30.00 |

    • Flash は小型モデルで最安、 Pro も大規模モデルで最安

効率性とアーキテクチャの特徴

  • 1Mトークンコンテキスト においても高効率
    • Proモデル :DeepSeek V3.2比で FLOPs27%・KVキャッシュ10%
    • Flashモデル :同じく FLOPs10%・KVキャッシュ7%
  • 効率化設計 により低コストを実現

性能・ベンチマーク

  • DeepSeek論文内ベンチマークで Proモデルはフロンティアモデルと競合
    • GPT-5.2やGemini-3.0-Pro よりも高性能
    • GPT-5.4やGemini-3.1-Pro にはやや劣る(約3~6ヶ月の開発差)

今後の展望・量子化モデル

  • Unslothチーム による量子化版モデルの公開が期待
  • Flashモデル がローカルマシンでどこまで動作するかに注目

Hackerたちの意見

最近、v4 proを使ってみたんだけど、正直なところ、品質的にはOpenAIの5.4やOpus 4.6とほぼ同じくらいかな(4.7は試してないけど)。言っておくけど、最先端のことをやってるわけじゃないよ。フロントエンド開発に使ってるんだけど、あんまり得意じゃないから、見た目がそこそこ良いプロトタイプが必要なんだ。でも、私の用途には十分なモデルだし、価格も悪くない。早くローカルで動かせるオープンモデルが出てほしいな。他人のマシンに頼るのは嫌だし、データが漏れちゃうのも怖いから。

経験をシェアしてくれてありがとう、私も試してみたいな。推論にはどのプロバイダーを使ってるの?OpencodeそれともDeepSeek API?

Tinfoilを使えば推論ができて、クラウドでモデルを使いつつ、ローカルで動かすのと同じくらいプライバシーを保てるよ:https://tinfoil.sh/inference。ちなみに、私は共同創業者です。これは、モデルをセキュアエンクレーブ内で実行して(NVIDIAの機密コンピューティングを使用)、エンクレーブ内で動いているオープンソースコードがランタイムの証明と一致していることを確認することで機能します。ドキュメントが検証プロセスを説明してるよ:https://docs.tinfoil.sh/verification/verification-in-tinfoil

今、AnthropicのMaxサブスクリプション(100ドルのやつ)を払ってるんだけど、5時間の制限にしょっちゅう達しちゃうか、近づいちゃう。リセット前にはだいたい週の制限の60〜80%くらいまで行くかな(Opus 4.7で全部高い思考を使ってるけど、CCがHaikuとかでサブエージェントを生成することに決めない限り)。そのトークンはかなり補助されてるけど、DeepSeekのAPI料金はすごく良さそう。例えば、エージェント的なコーディングセットアップ(入力85%、出力15%、キャッシュリード90%くらい)だと、同じ100ドルで月に約150Mトークンが手に入る。出力トークンがもっと多くてキャッシュパフォーマンスが悪くても、100M以上は確実にいけそう。

Twitterで誰かが、現在の価格レベルで約10ドルで>200Mトークンを手に入れたって言ってたよ。

V4 APIの非補助金価格はどれくらいになるの?大きなモデルの3倍安く設定できるのかな?OpenRouterでは、この1600Bパラメータモデルが0.4ドルで、Kimi 2.6の1000Bパラメータは0.7ドル、GLM 5.1の754Bパラメータは1.0ドルだよ。

フラッシュを使ってるけど、めっちゃいいよ。150Mトークンで2ドル。

Deepseek v4 ProはClaude Opus 4.6に似た性格を持ってるけど、コストについてわかったことをシェアするね。私はDeepseek v4を使って、そこそこ大きなTypescriptコードベースで、特定のエンドポイントにだけ集中して、層ごとに深掘りするように頼んだんだ(API、DTO、サービス、データベースモデルなど)。それで、関わる型の全体像を形成して、アドホックな型が導入されないようにした。型の導入についての非常に簡潔で的を絞った要約ができて、どの型が返金されたかもわかったよ。それから、全部を簡略化するように頼んだ。明らかに両方のプロンプトでたくさんのファイルを確認してたけど、総コストは?たったの0.09ドルだった。Claude Opusだと(値上げ前の経験から)この2つのプロンプトだけで9ドルから13ドルくらいは簡単に使ってたと思う。注意点として、Open routerは使わずにDeepseek APIを直接使ったよ。Open router自体がDeepseekに制限されてたから。

75%の割引を考慮しても、まだかなり安いよね。

Opus 4.6と似てるのは名前の4だけだね。こういう不誠実な比較が理解できない。OOSモデルはクールで、安くて、未来に期待できるけど、なんで実際よりも良いふりをしてるんだろう?

どうやって使ったの?OpenRouter、それとも直接プロバイダーから?

Deepseekの価格ページから: (3) deepseek-v4-proモデルは現在75%の割引が適用されていて、2026年5月31日15:59 UTCまで延長されてる。このモデルをレビューする際にこれが考慮されたの?

Hacker Newsで議論の続きを見る