ハクソク

世界を動かす技術を、日本語で。

Qwen3-Coder: 世界におけるエージェント的コーディング

2025年7月23日原文(qwenlm.github.io)

概要

Qwen3-Coder は、エージェント型コーディングに特化した最先端の大規模言語モデル
最大 480Bパラメータ のMixture-of-Experts構造と 35Bアクティブパラメータ を持つ
256Kトークン の長文コンテキストをネイティブサポート、最大1Mトークンまで拡張可能
Qwen Code など多様なCLIツール・API対応、開発者ツールとの高い互換性
今後さらなるモデルサイズ展開と自己改善能力の研究を継続

Qwen3-Coder概要

Qwen3-Coder は、エージェント型のコーディングやツール利用に強みを持つ大規模言語モデル
最上位モデル Qwen3-Coder-480B-A35B-Instruct は、 480Bパラメータ のMixture-of-Experts構造
35Bアクティブパラメータ で、実際の推論時は効率的な計算資源利用
256Kトークン の長大なコンテキストをネイティブサポート、 YaRN 方式で最大1Mトークンまで対応
Agentic Coding/Browsing/Tool-Use 領域でClaude Sonnet 4と並ぶSOTA性能

事前学習とデータスケーリング

7.5兆トークン （うち70%がコード）の大規模データで事前学習
Qwen2.5-Coder を活用しノイズ除去やデータクレンジングを徹底
リポジトリ規模 やプルリクエスト等の動的データにも最適化
合成データ の活用でデータ品質を大幅に向上

強化学習による後処理

大規模Code RL （強化学習）で実行可能なコード生成能力を強化
多様な実タスクのテストケース自動生成により、RL訓練データを拡充
SWE-Bench など現実的なソフトウェア工学タスクにも対応
20,000並列環境 をAlibaba Cloud上に構築し、長期的なエージェントRLを実現

Qwen Codeとツール連携

Qwen Code はGemini CLIをベースに開発されたCLIツール
Node.js 20+ が必要
- インストール例:
  - curl -qL https://www.npmjs.com/install.sh | sh
  - npm i -g @qwen-code/qwen-code
  - ソースからの導入も可能
OpenAI SDK互換、APIキーやエンドポイントは.envまたは環境変数で設定
コマンド例:
- qwenでインタラクティブなコーディング体験

Claude Codeや他ツールとの連携

Claude Code にもQwen3-Coderを統合可能
Alibaba Cloud Model StudioでAPIキー取得
インストール例:
- npm install -g @anthropic-ai/claude-code
Claude Code Proxy API や claude-code-config でバックエンドモデルを柔軟に切替
Cline など他開発ツールでもOpenAI互換APIとして設定可能

API利用例

Python（openaiパッケージ） から直接呼び出し可能
- base_urlにhttps://dashscope-intl.aliyuncs.com/compatible-mode/v1を指定
- モデル名はqwen3-coder-plus
サンプルプロンプト:
- オンライン書店のWebページ作成依頼など

今後の展望

より大規模・低コストなモデル展開を計画
エージェントの自己改善や複雑なタスク自動化への挑戦
ソフトウェア開発現場での生産性向上への貢献を目指す

Hackerたちの意見

Cloud 4にマッチするオープンウェイトモデル、めっちゃワクワクするね！MoEだから、ローカルで動かすのも全然可能だよ。

└

やった！Coderにめっちゃワクワクしてる！！

└

480GBをどこに置けば、何とかスピードを出せるの？そんなにRAM持ってるの？

Qwen3-Coder-480B-A35B-Instructを動かすには、どんなハードウェアが必要なんだろう？性能がSonnetに匹敵するらしいから、重いClaude Codeを使ってる人たちもローカルで動かしたいって思うかも。Claude Code用の設定方法もあるみたいだし。Xでは使用料の高額請求がよく話題になってるから、もしかしたら経済的にもなるかもね（例えば6人でローカルインスタンスを共有するとか）。

└

RAMは最低でも500GBは必要だけど、コンテキスト用にさらに100〜200GBは必要だね。24GBのGPUと組み合わせれば、スピードは10t/sは出ると思うよ。

└

今、彼らのためにダイナミックGGUFクオンツを作ろうとしてるんだ！ダイナミック2ビットくらいには24GBのVRAMと128GBのRAMが必要だよ。1時間くらいでできるはずだよ： https://huggingface.co/unsloth/Qwen3-Coder-480B-A35B-Instruc.... ローカルで動かすためのドキュメントも持ってるよ： https://docs.unsloth.ai/basics/qwen3-coder

└

ベンチマークのアークを使って本物のバージョンを動かすには、非量子化の非蒸留版が必要だね。だから、最新の状態にするなら8台のH200のクラスターが必要だと思う。今はB200もあって、こっちの方がずっと速いけど、値段もめっちゃ高いよ。30万ドル以上だし。量子化された蒸留版を作る人もいるけど、ベンチマーク結果は絶対に出さないんだよね。

└

特に高級なものである必要はないよ。RTX Pro 6000と256GBのRAMで十分だよ。

└

ここに4ビット版があって、512GBのM3 Mac Studioで約272GBのRAMを使うみたいだよ。動画もあるよ: https://x.com/awnihannun/status/1947771502058672219 そのマシンは約1万ドルするらしい。

みんながOpenHandsをスキャフォールドとして使ってるのを見るのは嬉しいね！公共のベンチマークレポートで「プライベートスキャフォールド」って見るのはほんとイライラするから。

└

robertからのAllHandsに関する詳しい情報（上記） https://youtu.be/o_hhkJtlbSs

└

認知がこんなに無能なのはどうして？彼らは数億ドルも持ってるのに、CursorやClaude Codeに取って代わられるだけじゃなく、元々「OpenDevin」と呼ばれていた文字通りのクローンにも置き換えられちゃった。

Hacker Newsで議論の続きを見る