DeepSeekが「V4 Pro」の価格割引を恒久化

2026年5月23日原文(api-docs.deepseek.com)

概要

DeepSeekモデルの価格体系と特徴を解説
1Mトークン単位での課金方式
入力・出力トークンごとに異なる価格設定
割引やプロモーション価格の適用期間
利用時の注意点や推奨事項

DeepSeekモデル価格・特徴まとめ

価格単位 ：1Mトークンごとに課金
トークン定義 ：単語・数字・記号など、モデルが認識する最小単位
課金対象 ：モデルへの入力・出力トークン合計数
モデル種類 ：DeepSeek-V4-Flash、DeepSeek-V4-Proの2種類
APIエンドポイント ：両モデルとも https://api.deepseek.com
- Anthropic形式も同一URL
バージョン ：DeepSeek-V4-Flash、DeepSeek-V4-Pro
思考モード ：非思考モード・思考モード（デフォルト）両対応
- 切り替え方法は「Thinking Mode」参照
コンテキスト長 ：最大1Mトークン
最大出力 ：384Kトークン
主な機能 ：
- JSON出力
- Tool Calls
- Chat Prefix Completion（β版）
- FIM Completion（β版、非思考モードのみ）

価格詳細（1Mトークンあたり）

入力トークン（キャッシュヒット時）
- DeepSeek-V4-Flash：$0.0028
- DeepSeek-V4-Pro（75%割引適用中）：$0.003625（通常$0.0145）
入力トークン（キャッシュミス時）
- DeepSeek-V4-Flash：$0.14
- DeepSeek-V4-Pro（75%割引適用中）：$0.435（通常$1.74）
出力トークン
- DeepSeek-V4-Flash：$0.28
- DeepSeek-V4-Pro（75%割引適用中）：$0.87（通常$3.48）

割引・価格調整

DeepSeek-V4-ProのAPI価格は、2026/05/31 15:59（UTC）まで75%割引
- 割引終了後、通常価格の1/4に正式調整予定
- 詳細：https://x.com/deepseek_ai/status/2057854261699195173
全モデルの入力キャッシュヒット価格は、2026/4/26 12:15（UTC）より1/10に値下げ

利用制限・注意事項

同時実行上限 ：Flash 2,500件、Pro 500件
旧モデル名 ：deepseek-chat（非思考モード）、deepseek-reasoner（思考モード）は今後廃止予定
料金計算式 ：利用トークン数 × 単価
支払い順序 ：付与残高が優先消費、その後チャージ残高
価格変更 ：DeepSeekの裁量で変更あり
推奨事項 ：実際の利用量に応じてチャージ、価格ページを定期確認

DeepSeek利用時のポイント

コスト管理 ：トークン数とキャッシュヒット率の把握が重要
割引期間 ：プロモーション終了時期・価格改定に注意
API制限 ：大量リクエスト時は同時実行数上限に留意
機能選択 ：用途に応じて思考モードや出力形式を選択
最新情報 ：公式ページやSNSでのアナウンスを随時確認

Hackerたちの意見

これはすごいコストパフォーマンスだね。GLM 5.1を使ってたけど、最近DeepSeek V4 Proを3週間くらい試してみたら、複雑なコーディングタスクにはGLM 5.1よりも良いって感じたよ。65万トークン使って、料金はたったの1.5ドル。めっちゃ安い！

└

Deepseekは他のモデルよりもずっと多くのトークンを使ってると思う。

彼らのMLAアーキテクチャは、標準のアテンションと比べてKVキャッシュを約5〜13倍削減してるんだ。それが推論を実際に安く実行できる理由で、単なる価格競争じゃないんだよね。

└

これはローカル推論にとってもゲームチェンジャーだね。長いコンテキストやバッチ推論ができるし、普通の消費者向けプラットフォームでKVキャッシュをディスクに保存できるようになるんだ。

└

そうだね。割引は新世代モデルのキャッシングの効率を試す「市場後試験」だったんじゃないかな。

彼らには拍手を送りたい。DeepSeek V4 Proは他の同カテゴリーのものと比べてもめちゃくちゃ安いよ。百万トークンあたりの価格を見てみて： DeepSeek V4 Pro: $0.87 Qwen 3.7 Max: $7.50 Grok 4.3: $2.50 GLM 1.5: $3.08 Opus 4.7: $25.00 GPT-5.5: $30.00

└

キャッシュの読み取りコストを見ると、実際にはもっと安いよ。そのコストはエージェントのワークフローでは大きな影響を与えるから、DeepSeekのキャッシュ読み取りコストは比較的にめちゃくちゃ安いんだ。$0.003626/Mトークンで、リストの中で一番安いものは> $0.2/Mトークンだよ。これは100倍安いってことだね。

└

*GLM 5.1

└

サブスクリプションがあれば、モデルが悪くなることはないよ！もし2ヶ月後にコスト削減のためにOpusをGPT-3よりも悪くされたら意味ないからね。

もし彼らが独自のコーディングエージェントを持つようになったら、主に彼らのモデルを使うかもしれない。オープンソースのモデルを出したり、研究を発表したり、みんなのために価格を低く保ったりして、彼らは「正しい」ことをしてるみたいだね。

└

なんで彼らにコーディングエージェントを提供してもらう必要があるの？市販のコーディングエージェントと一緒に彼らのモデルを使えばいいじゃん。私はPiが好きだけど、自分に合ったものを使えばいいよ。

└

もう「彼らのコーディングエージェント」は必要ないよ。Claude Codeを使ってDeepseekに接続できる。完璧に動くよ。

Hacker Newsで議論の続きを見る

ハクソク