世界を動かす技術を、日本語で。

DeepSeekが「V4 Pro」の価格割引を恒久化

概要

  • DeepSeekモデルの価格体系と特徴を解説
  • 1Mトークン単位での課金方式
  • 入力・出力トークンごとに異なる価格設定
  • 割引やプロモーション価格の適用期間
  • 利用時の注意点や推奨事項

DeepSeekモデル価格・特徴まとめ

  • 価格単位 :1Mトークンごとに課金
  • トークン定義 :単語・数字・記号など、モデルが認識する最小単位
  • 課金対象 :モデルへの入力・出力トークン合計数
  • モデル種類 :DeepSeek-V4-Flash、DeepSeek-V4-Proの2種類
  • APIエンドポイント :両モデルとも https://api.deepseek.com
    • Anthropic形式も同一URL
  • バージョン :DeepSeek-V4-Flash、DeepSeek-V4-Pro
  • 思考モード :非思考モード・思考モード(デフォルト)両対応
    • 切り替え方法は「Thinking Mode」参照
  • コンテキスト長 :最大1Mトークン
  • 最大出力 :384Kトークン
  • 主な機能
    • JSON出力
    • Tool Calls
    • Chat Prefix Completion(β版)
    • FIM Completion(β版、非思考モードのみ)

価格詳細(1Mトークンあたり)

  • 入力トークン(キャッシュヒット時)
    • DeepSeek-V4-Flash:$0.0028
    • DeepSeek-V4-Pro(75%割引適用中):$0.003625(通常$0.0145)
  • 入力トークン(キャッシュミス時)
    • DeepSeek-V4-Flash:$0.14
    • DeepSeek-V4-Pro(75%割引適用中):$0.435(通常$1.74)
  • 出力トークン
    • DeepSeek-V4-Flash:$0.28
    • DeepSeek-V4-Pro(75%割引適用中):$0.87(通常$3.48)

割引・価格調整

  • DeepSeek-V4-ProのAPI価格は、2026/05/31 15:59(UTC)まで75%割引
    • 割引終了後、通常価格の1/4に正式調整予定
    • 詳細:https://x.com/deepseek_ai/status/2057854261699195173
  • 全モデルの入力キャッシュヒット価格は、2026/4/26 12:15(UTC)より1/10に値下げ

利用制限・注意事項

  • 同時実行上限 :Flash 2,500件、Pro 500件
  • 旧モデル名 :deepseek-chat(非思考モード)、deepseek-reasoner(思考モード)は今後廃止予定
  • 料金計算式 :利用トークン数 × 単価
  • 支払い順序 :付与残高が優先消費、その後チャージ残高
  • 価格変更 :DeepSeekの裁量で変更あり
  • 推奨事項 :実際の利用量に応じてチャージ、価格ページを定期確認

DeepSeek利用時のポイント

  • コスト管理 :トークン数とキャッシュヒット率の把握が重要
  • 割引期間 :プロモーション終了時期・価格改定に注意
  • API制限 :大量リクエスト時は同時実行数上限に留意
  • 機能選択 :用途に応じて思考モードや出力形式を選択
  • 最新情報 :公式ページやSNSでのアナウンスを随時確認

Hackerたちの意見

これはすごいコストパフォーマンスだね。GLM 5.1を使ってたけど、最近DeepSeek V4 Proを3週間くらい試してみたら、複雑なコーディングタスクにはGLM 5.1よりも良いって感じたよ。65万トークン使って、料金はたったの1.5ドル。めっちゃ安い!

Deepseekは他のモデルよりもずっと多くのトークンを使ってると思う。

彼らのMLAアーキテクチャは、標準のアテンションと比べてKVキャッシュを約5〜13倍削減してるんだ。それが推論を実際に安く実行できる理由で、単なる価格競争じゃないんだよね。

これはローカル推論にとってもゲームチェンジャーだね。長いコンテキストやバッチ推論ができるし、普通の消費者向けプラットフォームでKVキャッシュをディスクに保存できるようになるんだ。

そうだね。割引は新世代モデルのキャッシングの効率を試す「市場後試験」だったんじゃないかな。

彼らには拍手を送りたい。DeepSeek V4 Proは他の同カテゴリーのものと比べてもめちゃくちゃ安いよ。百万トークンあたりの価格を見てみて: DeepSeek V4 Pro: $0.87 Qwen 3.7 Max: $7.50 Grok 4.3: $2.50 GLM 1.5: $3.08 Opus 4.7: $25.00 GPT-5.5: $30.00

キャッシュの読み取りコストを見ると、実際にはもっと安いよ。そのコストはエージェントのワークフローでは大きな影響を与えるから、DeepSeekのキャッシュ読み取りコストは比較的にめちゃくちゃ安いんだ。$0.003626/Mトークンで、リストの中で一番安いものは> $0.2/Mトークンだよ。これは100倍安いってことだね。

*GLM 5.1

サブスクリプションがあれば、モデルが悪くなることはないよ!もし2ヶ月後にコスト削減のためにOpusをGPT-3よりも悪くされたら意味ないからね。

もし彼らが独自のコーディングエージェントを持つようになったら、主に彼らのモデルを使うかもしれない。オープンソースのモデルを出したり、研究を発表したり、みんなのために価格を低く保ったりして、彼らは「正しい」ことをしてるみたいだね。

なんで彼らにコーディングエージェントを提供してもらう必要があるの?市販のコーディングエージェントと一緒に彼らのモデルを使えばいいじゃん。私はPiが好きだけど、自分に合ったものを使えばいいよ。

もう「彼らのコーディングエージェント」は必要ないよ。Claude Codeを使ってDeepseekに接続できる。完璧に動くよ。

Claude Codeを使ってV4 Proも使えるよ。[1] 試してみたけど、すごく良かった。

antirezのds4-agentはかなりうまく動いてるよ。96GB RAM以上のApple Siliconデバイスで動くし。

OpenCodeとは相性がめっちゃいいよ。うちのチームは他のサブスクリプションで5時間の制限にいつも引っかかってるから、Deepseekがバックアップとしてあるのはありがたい。50ドル入れたけど、全然使い切る気がしない。まだフロンティアモデルを完全に置き換えるほどの性能はないけど、バックアップとしては最高だね!

主要なコーディングエージェントはすでにDeepSeekをサポートしてるよ。

今週の初めに、自分のコードベースで中国のモデルをテストし始めたんだ。インタラクティブコーディングはまだ見てないけど、問題のトリアージやバグの自動修正、ログ分析なんかに注目してる。DeepSeek、Kimi、GLM、Qwen、MiMOをGPT-5.5ハイを基準にして使ってみたけど、全部Piハーネスで何もインストールせずに動かしたよ。今のところ、KimiとMiMOが一番期待できそう。まだ厳密にテストしてないから強いことは言えないけど、最初の印象では、実際にはこれらのモデルが日常的なタスクでは思ったより遅れを取ってないかも。ちょっと「頑張って働く」って感じかな。似たような結果を得るのに時間がかかってトークンも多く使うけど、値段はかなり安いし。

まだ試してないなら、Piを試してみて。ベンダーハーネスのロックインは避けよう。

Zedのエージェントは、今やDeepSeek APIキーをネイティブにサポートしてるよ。 (コストを最も抑えたいなら、OpenRouter経由では使わない方がいいよ)

5ドルで素晴らしいことをいくつかやったことがあるよ、オープンコードを使って。試してみて、信じられないくらい安いから。

DeepSeek V4を試してないなら、損してるよ。価格が信じられないくらい良いんだ。DeepSeekの思考の流れはすごく面白いよ。オープンコードでは見えないけど、読んでみるとモデルがどれだけ過小評価されてるか驚くと思う。私のモデル使用は少ないけど、彼らのモデルをオープンソースにしてくれた感謝の気持ちを込めて、定期的にDeepSeekに直接支払ってるよ。

そうだね、モデルは本当に良いよ。仕事でClaudeを使って、プライベートでDeepseekも試してるけど、これだけは積極的にバンククリプトしようとしてこない唯一のモデルだね。

良いし安いけど、政治の話をすると何かの検閲ルールが発動するかもしれないから気をつけて。考えてるのが見えるけど、突然すべてを消して別の話題に切り替えようとするんだよね、何も説明せずに。ニュースメディアが人々のためにサービスしてるっていう一般的なメッセージを出したこともあった。どちらの時も、敏感なリクエストはしてないのに驚いたよ。違法でも反体制的でもないのにね。でも、政治的なトピックだったから、それで十分だった。西側の検閲は通常もっと微妙だから、ちょっとゾッとするけど新鮮でもあった。

特定のことにはV4 Proを使ってるけど、コーディングにはV4 Flashにかなり感心してる。簡潔で、要点を押さえてて、ミスも少なくて、かなり速いね。

中国ホストのモデルは、アメリカのホストのモデルと比べて、環境ファイルをエージェントが読み取るような偶発的なデータ漏洩が心配だな。中国政府がチャットをスキャンして有用な情報を保存する可能性がアメリカより高いんじゃないかって疑ってもおかしくないよね。このコメントを投稿するのもためらったけど、偏見や排外的に聞こえちゃうから。誰か私が間違ってるって納得させてくれる人いないかな?Deepseekをホスティングしてる会社について、データプライバシーを尊重してる歴史とか知ってる人いる?

ユーザーデータの整合性は確かに心配すべきことだね。規制が追いついていないのも知られているし、フロンティア製品を使うことのコストは二重の刃だよね。

それが起こる可能性はゼロじゃないと思う。北京はいつでもDeepSeekが強力すぎると判断して、主要な輸出品になってしまったら、介入を始めるかもしれない(すでにしてるかもしれないけど)。外国の勢力(中国に限らず)がアメリカの多くの業界の重要なネットワークに大量に侵入して、適切なタイミングを待っているという報告が広まってる。フロンティアモデルは単なる攻撃ベクトルの一つだし、考えてみればもっと簡単に悪用されるよ。実際、クラウドホスティングされたモデルには、意図的に作った会社の仕業か、悪意のあるアクターが脆弱性を悪用するかに関わらず、こういった可能性があるんだ。

理不尽な懸念ではないから、ほとんどのアメリカの企業はAWSのベッドロックやAIラボのどれかを選ぶのが好きで、通常はデータ保持契約を求めないんだよね。でも、ホスティング場所に関係なく漏洩のリスクはあるし、結局はインセンティブが変わるだけだと思う。例えば、ラボではすべてのチャットをスキャンして、企業のZDR契約に含まれないデータでトレーニングしてるし。法執行機関は、有効な令状や緊急時の文脈で全ユーザーデータへのアクセスを要求できるよ。 もしプライベートにDeepSeek V4を試してみたいなら、Tinfoil(tinfoil.sh)を使ってみて。すべてのモデルが証明されたセキュアなハードウェアエンクレーブでホストされてて、推論はエンドツーエンドでプライベートだよ。ちなみに、私は共同創業者の一人です。

もっとありそう?アメリカのテックリーダーたちは、10年以上も監視国家に完全に屈服してるからね。中国が私のデータで何をするかなんて気にしないよ。私は中国に住んでないし、住む予定もないし。テックブロの脅威モデルは、ずっと純粋な愛国主義と外国嫌悪だったから。皮肉なことに、中国の企業が私のデータでやった最悪のことは、TikTokをアメリカのテクノファシストに売ったことだね。

Azureみたいなもので使えばいいよ。彼らが全モデルをホストして、アメリカから提供してるから。こういうプロバイダーは他にもあると思う。私たちもその方法で使ってて、すごくうまくいってるよ。

これはリスクだけど、幸いにもこれは中国のホスティングに結びついてないモデルだからね。でも、DeepSeek.comをそのまま使うなら考慮すべきことだね。

それをやるとは全然驚かないよ。アメリカ本社のモデルが他の政府のためにそうするのも、あんまり驚かない。データの機密性については、あまり期待しない方がいいかも。Microsoftは企業向けのチェックリストを全部クリアしてるよね?でも、Azureは時々侵害されてるし。

中国の誰かがわざわざ俺を攻撃するほど重要じゃないから大丈夫だよ。DeepSeekはユーザーがプラットフォームを使い続けるために、十分な信頼を維持しなきゃいけないし、みんなの暗号ウォレットを狙うキーロガーみたいにはなれない。もし中国政府が戦略的に重要だと思うことに取り組んでたら、確かに心配するけど、そういうことはしてないから。むしろ、こっちの国のテックブロが自分のLLMを使って俺を徹底的にプロファイリングして、中国の社会信用スコアよりも遥かにディストピア的なものを生み出す方が心配だよ。中国政府を心配すべきだって言ってる人たちが、実はアメリカにいる個人として本当に心配すべき人たちかもしれないね。

これをやってくれることを期待してた。データプライバシーが気になるものはローカルでFlashを使い続けるけど、APIを通じてのProの価値は他の何よりもすごいからね(オープンモデルを出し続ける限り、トレーニングデータを提供したいと思ってる)。

V4 Proの割引があっても、V4 Flashモデルはドル単位あたりのパフォーマンスが最高で、エージェント的でツール重視のワークロードには全体的により良いパフォーマンスを提供してる。V4 Proは一発推論が賢いけど、かなりの速度差がある。パフォーマンス、コスト、速度を考えると、V4 Flashは今のところ私たちのトップフラッシュモデルだよ。データは https://gertlabs.com/rankings

俺の使い方では(主に非常に大きな要約とアイデア抽出)、Proと比べるとかなり微妙だね。

キャッシングについてもっと気になってるんだ。> 「すべてのモデルで、入力キャッシュのヒット価格が発売価格の1/10に引き下げられました。この価格調整は2026年4月26日12:15 UTCから有効です。終了日はありません。現在、DeepSeek V4 Flashの入力価格は2%、新しいV4 Proの価格では0.8%で、競合他社と比べても非常に低いです。これがユニットエコノミクスに少し影響を与えると思ったんだけど、一時的なものだと思ってた。V4 Proの場合、キャッシングを考慮すると、実質的なコストは約$0.04/Mの入力トークンです(OpenRouterのメトリクスに基づく: https://openrouter.ai/deepseek/deepseek-v4-pro)。これは競合他社の小さなモデルよりもかなり安い。」

Sonnet : キャッシュ読み込み $0.30、Gemini 3.5 Flash : キャッシュ読み込み $0.15

Flash単体はあまり競争力のあるモデルじゃないね。価格は市場の他のものと同じ範囲にあるし。Flashモデルの最も直接的な競合は、GPT 5.4 miniで、キャッシュ読み込みは$0.075/Mトークン、Gemini 3 Flashはキャッシュ読み込み$0.05/Mトークン。特に魔法のようなものや画期的なものはないよ。

誰かがコパイロットに接続しようとしてるなら、ちょっと前に接続を扱うためのプロキシスクリプトを作ったから、役に立つかも: https://gist.github.com/g023/c2bb7b540ffe64cee76023f18f6f936...