世界を動かす技術を、日本語で。

DS4についてのいくつかの言葉

2026年5月15日原文(antirez.com)

概要

  • DwarfStar 4 (DS4) の急速な人気上昇
  • DeepSeek v4 Flash によるローカルAI体験の革新
  • 2/8ビット量子化 で大容量RAMによる高速動作の実現
  • 今後の展望 として多様な専門モデルや分散推論への期待
  • ローカルAIの重要性 と個人での利用推進

DwarfStar 4 (DS4)の急成長と背景

  • DS4 のGitHub公開後、予想以上の急速な人気拡大
  • 単一モデル統合型ローカルAI体験 への強いニーズの存在
  • DeepSeek v4 Flash の登場により、ローカル推論のゲームチェンジ
  • 2/8ビット量子化手法 により、96GBまたは128GBのRAMで十分な運用が可能
  • ローカルAIムーブメント による過去数年の知見の蓄積と活用

開発体験と今後の方向性

  • 1日平均14時間 の開発作業、Redis初期と同様の集中
  • DS4 はDeepSeek v4 Flash専用ではなく、今後モデル変更も視野
  • 高性能MacやGPUボックス で実用的に高速なオープンモデルが主役になる予想
  • DeepSeek v4 Flash の新しいチェックポイントや、コーディング特化型などのバリアント登場への期待
  • 用途別モデル (ds4-coding, ds4-legal, ds4-medical等)の必要性
    • 質問内容に応じて必要なモデルを切り替え利用

ローカル推論の新しい可能性

  • ClaudeやGPT に頼っていた本格的な用途にもDS4を活用
  • ベクターステアリング による自由度の高いLLM体験
  • DeepSeek v4 Flash の圧倒的な性能への賞賛
  • ローカルモデル体験AフロンティアモデルB の中間以上の品質を実感

今後の課題と開発計画

  • 品質ベンチマーク の充実
  • コーディングエージェント のプロジェクト統合検討
  • 自宅ハードウェア環境 でのCIテスト実施による長期品質保証
  • さらなる移植 (ポーティング)の推進
  • 分散推論 (シリアル・パラレル両対応)の実現

ローカルAIの意義とメッセージ

  • AIは単なる提供サービスにとどまるべきでない という信念
  • 個人利用・自律運用 の重要性を強調
  • コミュニティからの支援 への感謝

Hackerたちの意見

この前、128GBのM5でこれを動かしてみたんだけど、かなりスムーズだったよ。モデルは約80GBのRAMで動いてて、コードを書くのもツールの実行もかなりできる感じだった。

トークンのスループットやレスポンスタイムはどう?

つまり、M5を買うべきってこと? :) ずっと抵抗してたけど、使わないだろうなって思って…来年にはもっと良くなるだろうし…スタジオを待つつもり(まだ6月に来ると思ってる?)…とか色々考えてる。

なんでモデル特化の推論エンジンを作るのか、llamacppを使えばいいのにって説明が見当たらないんだよね。llamacppの統合に取り組んでる人がたくさんいるのに、これは一つのモデルに多くの労力をかけてる気がする。別のモデルが出てきたら、そっちの方が良くなる可能性が高いし。最近の議論では、llamacppのブランチやds4に対してPRを出してる人もいるから、開発に時間を投資してる人たちが分散しちゃってるんだよね。

著者は何度も、llama.cppのメンテナはAIが書いたコードを人間の修正なしで使いたくないと言ってるんだよね。もし誰かがそのプロジェクトにサポートを上流に持っていこうとしたいなら、自由にやっていいよ。コードはMITライセンスだから。

前提として、コードは安い、コラボレーション(例えば上流化)は高いってことだと思うんだけど、これって本当?数年後にわかるかな。

ある時点で、大きくて柔軟なプロジェクト(例えば、llama.cppやLinux)に必要な抽象化や一般化のレベルが、膨大な数のファイルに膨れ上がっちゃうんだよね。もっと新しくて小さいものの方が、早く動けるかも。

antirezの最近の関連ツイート: https://x.com/antirez/status/2054854124848415211 > 最近のDS4フィエスタで、私だけでなく他の貢献者もGPT 5.5がものすごく役立つと感じて、Opusは全く役に立たなかったことを思い出させる優しいリマインダー。パフォーマンスを最大限に引き出すための低レベルなコード作業でも同じことを感じたよ。

Code/Codexについて話してるとして、APIの課金かサブスクリプションどっち?僕は実質無制限のAPI課金が使えるけど、Opusのバージョン間で品質が落ちた感じは全然ないよ。

パフォーマンスのベンチマークがあって、モデルベンダーが最適化してない気がする。GSOの最新結果では、Opus 4.6と4.7がGPT 5.5をわずかに上回ってる。これも僕の経験と一致してる。 https://gso-bench.github.io/

これがclaudeにどれだけ近いか、驚くよね。もちろん、かなり遅いけど、そんなにバカになってるとは思わない。面白いことに、imatrixの量子化は、オープンルーターのzdr推論バックエンドが使ってるものよりも良さそう。昨日は、自分のサーバープロセスが自分自身だって気づいてたから、これまでローカルモデルでそんなこと見たことなかったんだよね。

僕の(明らかに経験則だけど)テストでは、DeepseekV4 ProはSonnetよりコーディングが得意だった。でも、すごく遅いし、今のプロモーションを考えると、めちゃくちゃ安いけどね。

Hacker Newsで議論の続きを見る