世界を動かす技術を、日本語で。

DeepSeekが推論最適化をオープンソース化、生成速度が60~85%向上[pdf]

2026年6月27日原文(github.com)

概要

  • DeepSpec プロジェクトのGitHubページでエラー発生
  • ページのリロードを求められる状況
  • 通知設定の変更には サインイン が必要
  • DSpark_paper.pdf ファイルの操作やダウンロードが可能
  • ユーザーインターフェースの主要な機能説明

DeepSpec GitHubページのエラーと操作案内

  • "Uh oh! There was an error while loading." というエラーメッセージ表示
  • ページを リロード することで復旧を試みる案内
  • 通知設定の変更には アカウントへのサインイン が必須
  • deepseek-ai / DeepSpec リポジトリの利用状況
    • Fork 数:34
    • Star 数:505
  • main/DSpark_paper.pdf ファイルに関する操作
    • ファイルサイズ: 706 KB
    • ダウンロード生データ表示 が可能
    • ファイルの 編集生データ編集 アクションも選択肢
  • ファイルツリー履歴 の閲覧機能
    • 最新コミット履歴 の追跡
  • ユーザー通知ファイル操作 のためのインターフェース提供

Hackerたちの意見

いいね。タイミングは偶然じゃない気がする。オープンさと厳しい規制の対比だね。

たぶん、これにはかなり前から取り組んでたんだろうね。それが、先月価格を劇的に下げられた理由の一つかも。

Lookahead Sparse Attentionも大きな役割を果たすはずだよ、メモリ消費を劇的に削減するからね。

近い将来、用途や企業、さらには個人に特化した小型モデルがめちゃくちゃたくさん出てくる世界が見えるよ。

そうであればいいけど、ハードウェアが手に入らなくなるのは勘弁だな。

そうだね、洗練されたガードレールにしっかり制約されてる。これが今後の流れだと思う。巨大な「世界を食べる」モデルは、比較すると極端にリターンが減ってるよ。

彼らのOCRを使ってるの?それとも他の誰かの?

Kilo CodeでDeepSeek v4 proを1ヶ月使ってるけど、めっちゃいいよ。速いし、信頼性も高いし、大きなコンテキストウィンドウがあって、安い…今月は15億トークン処理して、40ドルだった(ほとんどキャッシュだったけどね)。

Claude Code(プロ)でどれだけトークンを使ったか見る方法ってある?

これは、DeepSeekが非常に安い価格でモデルを提供するために発表した多くの論文の一つに過ぎない。他の企業がデータセンターを作るために1000億ドル以上の負債を抱えているのとは違ってね。 「V4-Flashと同様に、私たちはこの点を、DSparkがベースラインが効率的にサポートできないインタラクティビティ目標の下で有用なスループットを維持していることの指標として扱います。システムの能力が一致している場合、DSparkはユーザーごとの生成を57%から78%速く提供します。」 2017年にメモリ集約型技術を使ってサーバーをスケールアップするために、さらに多くのサーバーを追加して問題を解決しようとした欠陥のある解決策を思い出すよ。(それじゃコストが増えるだけ。)そうするんじゃなくて、アプリのどの重要な部分をもっとパフォーマンスの良い技術で書けるか考えてみて。2026年に進むと、問題に対してただお金を投げつけてさらに問題を増やしている人たちが見える一方で、DeepSeekは最適化されたソリューションを提供しているのがわかる。誰に注目すべきかははっきりしてるし、絶対にAnthropicじゃないね。

OpenAIのボードメンバーやPE投資家でいるのは素晴らしいだろうね、でも中国が足元で鉱山を爆破してるのに笑っちゃうよ。幸い、韓国の年金基金がいつものようにゴミを買ってくれるけど、マジで早く動かないと、そろそろ本気のAGIが必要になるかもね、どうやってその債券を処分するか教えてもらわないと。

「我々は機械の神を作り、それが自分を支払ってくれるように祈る。」

Hacker Newsで議論の続きを見る