世界を動かす技術を、日本語で。

Qwen3-Coder: 世界におけるエージェント的コーディング

概要

  • Qwen3-Coder は、エージェント型コーディングに特化した最先端の大規模言語モデル
  • 最大 480Bパラメータ のMixture-of-Experts構造と 35Bアクティブパラメータ を持つ
  • 256Kトークン の長文コンテキストをネイティブサポート、最大1Mトークンまで拡張可能
  • Qwen Code など多様なCLIツール・API対応、開発者ツールとの高い互換性
  • 今後さらなるモデルサイズ展開と自己改善能力の研究を継続

Qwen3-Coder概要

  • Qwen3-Coder は、エージェント型のコーディングやツール利用に強みを持つ大規模言語モデル
  • 最上位モデル Qwen3-Coder-480B-A35B-Instruct は、 480Bパラメータ のMixture-of-Experts構造
  • 35Bアクティブパラメータ で、実際の推論時は効率的な計算資源利用
  • 256Kトークン の長大なコンテキストをネイティブサポート、 YaRN 方式で最大1Mトークンまで対応
  • Agentic Coding/Browsing/Tool-Use 領域でClaude Sonnet 4と並ぶSOTA性能

事前学習とデータスケーリング

  • 7.5兆トークン (うち70%がコード)の大規模データで事前学習
  • Qwen2.5-Coder を活用しノイズ除去やデータクレンジングを徹底
  • リポジトリ規模 やプルリクエスト等の動的データにも最適化
  • 合成データ の活用でデータ品質を大幅に向上

強化学習による後処理

  • 大規模Code RL (強化学習)で実行可能なコード生成能力を強化
  • 多様な実タスクのテストケース自動生成により、RL訓練データを拡充
  • SWE-Bench など現実的なソフトウェア工学タスクにも対応
  • 20,000並列環境 をAlibaba Cloud上に構築し、長期的なエージェントRLを実現

Qwen Codeとツール連携

  • Qwen Code はGemini CLIをベースに開発されたCLIツール
  • Node.js 20+ が必要
    • インストール例:
      • curl -qL https://www.npmjs.com/install.sh | sh
      • npm i -g @qwen-code/qwen-code
      • ソースからの導入も可能
  • OpenAI SDK互換、APIキーやエンドポイントは.envまたは環境変数で設定
  • コマンド例:
    • qwenでインタラクティブなコーディング体験

Claude Codeや他ツールとの連携

  • Claude Code にもQwen3-Coderを統合可能
  • Alibaba Cloud Model StudioでAPIキー取得
  • インストール例:
    • npm install -g @anthropic-ai/claude-code
  • Claude Code Proxy APIclaude-code-config でバックエンドモデルを柔軟に切替
  • Cline など他開発ツールでもOpenAI互換APIとして設定可能

API利用例

  • Python(openaiパッケージ) から直接呼び出し可能
    • base_urlhttps://dashscope-intl.aliyuncs.com/compatible-mode/v1を指定
    • モデル名はqwen3-coder-plus
  • サンプルプロンプト:
    • オンライン書店のWebページ作成依頼など

今後の展望

  • より大規模・低コストなモデル展開を計画
  • エージェントの自己改善や複雑なタスク自動化への挑戦
  • ソフトウェア開発現場での生産性向上への貢献を目指す

Hackerたちの意見

Cloud 4にマッチするオープンウェイトモデル、めっちゃワクワクするね!MoEだから、ローカルで動かすのも全然可能だよ。

やった!Coderにめっちゃワクワクしてる!!

480GBをどこに置けば、何とかスピードを出せるの?そんなにRAM持ってるの?

Qwen3-Coder-480B-A35B-Instructを動かすには、どんなハードウェアが必要なんだろう?性能がSonnetに匹敵するらしいから、重いClaude Codeを使ってる人たちもローカルで動かしたいって思うかも。Claude Code用の設定方法もあるみたいだし。Xでは使用料の高額請求がよく話題になってるから、もしかしたら経済的にもなるかもね(例えば6人でローカルインスタンスを共有するとか)。

RAMは最低でも500GBは必要だけど、コンテキスト用にさらに100〜200GBは必要だね。24GBのGPUと組み合わせれば、スピードは10t/sは出ると思うよ。

今、彼らのためにダイナミックGGUFクオンツを作ろうとしてるんだ!ダイナミック2ビットくらいには24GBのVRAMと128GBのRAMが必要だよ。1時間くらいでできるはずだよ: https://huggingface.co/unsloth/Qwen3-Coder-480B-A35B-Instruc.... ローカルで動かすためのドキュメントも持ってるよ: https://docs.unsloth.ai/basics/qwen3-coder

ベンチマークのアークを使って本物のバージョンを動かすには、非量子化の非蒸留版が必要だね。だから、最新の状態にするなら8台のH200のクラスターが必要だと思う。今はB200もあって、こっちの方がずっと速いけど、値段もめっちゃ高いよ。30万ドル以上だし。量子化された蒸留版を作る人もいるけど、ベンチマーク結果は絶対に出さないんだよね。

特に高級なものである必要はないよ。RTX Pro 6000と256GBのRAMで十分だよ。

ここに4ビット版があって、512GBのM3 Mac Studioで約272GBのRAMを使うみたいだよ。動画もあるよ: https://x.com/awnihannun/status/1947771502058672219 そのマシンは約1万ドルするらしい。

みんながOpenHandsをスキャフォールドとして使ってるのを見るのは嬉しいね!公共のベンチマークレポートで「プライベートスキャフォールド」って見るのはほんとイライラするから。

robertからのAllHandsに関する詳しい情報(上記) https://youtu.be/o_hhkJtlbSs

認知がこんなに無能なのはどうして?彼らは数億ドルも持ってるのに、CursorやClaude Codeに取って代わられるだけじゃなく、元々「OpenDevin」と呼ばれていた文字通りのクローンにも置き換えられちゃった。

「qwen-code」アプリは、gemini-cliのフォークっぽいね。これらのOSS CCクローンがいつか集約されるといいな。実際、ページにも書いてあるけど、エージェントコーディング用のコマンドラインツール「Qwen Code」をオープンソースにする予定だよ。Gemini Codeからフォークしたみたい。

現在、基本的にはclaude-codeをディレクターとして使ってるけど、重い思考はopenaiとgemini proにzen mcpを通じてアウトソースしてる。zenに対応してるからgemini-cliを使うこともできると思う。gemini-cliをベースにしてるなら、qwen-coderのサポートを追加するのは簡単だろうね。

彼らはClaude Codeもサポートしてるけど、私の理解ではClaude Codeはクローズドソースで、Clade APIエンドポイントのみサポートしてるんだよね。どうやって動かしてるのかな?

RA.Aidを出荷したのは2024年の終わりで、CCが出荷するずっと前のことだよ。私たちの主な焦点は、1) CLIファースト、2) 本当にオープンソースのコミュニティを作ることだった。5人の独立したメンテナーがいて、全員がフルコミットアクセスを持ってる。彼らは同じ組織や団体から来てないよ(注: 一人は私のスタートアップGobiiに参加していて、ウェブブラウジングエージェントに取り組んでる)。誰かCCとの比較をしてくれると嬉しいけど、私の経験ではCursorやWindsurf、他のエージェントコーディングソリューションに対抗できてると思う。でも、特定の大企業やモデルに縛られない、正当なFOSSソリューションが必要だよね。

今、ローカルデプロイ用に2bitから8bitのGGUFを作ってるところ!1時間くらいでここにアップする予定だよ:https://huggingface.co/unsloth/Qwen3-Coder-480B-A35B-Instruc... それと、24GBのGPUと128〜256GBのRAMでの実行方法についてのドキュメントもここにあるよ:https://docs.unsloth.ai/basics/qwen3-coder

ドキュメントに誤字があるみたいだね:推奨コンテキスト:65,536トークン(増やせる) これは推奨トークン出力で、公式ドキュメントにも「適切な出力長:ほとんどのクエリには65,536トークンの出力長を使用することを推奨します。これは指示モデルに適しています。」って書いてあるよ。

Qwen3-Coderは複数のサイズで利用可能だけど、まずは最も強力なバリアントを紹介できることにワクワクしてる。 小さいサイズの方が楽しみだな。ローカルで動かせるモデルがあって、時々まあまあのコードを書けるのが興味あるから、近づいてると思う。でも、今後しばらくは、自分のコンピュータで現実的にホストできない大きなモデルを「呼び出したい」と思うことがあるだろうから、高品質なオープンウェイトモデルの選択肢があるのは嬉しいし、遊んでる小さいオープンウェイトモデルのために、大きいモデルへのアクセスをレンタルして「支払う」ってアイデアもいいと思う。Qwenチームのリリース、おめでとう!試してみるのが楽しみだよ。

小さいモデルは大きいモデルには絶対に勝てないよ。大きいモデルはもっと知識があって、賢いからね。小さいモデルも賢くなれるけど、そうなると大きいモデルも賢くなる。HNは変な場所で、かつては技術的な人たちが一番多かったけど、今はLLMについてはredditで見つけることが多い。たくさんの人が巨大なモデルを動かしてるから、リサーチしてみれば、自分でホスティングできることがわかるよ。

こんな変化についていくのはどうすればいいんだろう?2〜3年先に進めて、実際の勝者が現れているか見てみたいな。そうなったら、THEツールがあって、他のものを使うことを考える人はいないと思う。

なんでそう思うの?リーダーボードは今すごく不安定で、それが収束する兆しもないよ。2〜3年後も同じ状況だと思うけど、ちょっと違うプレイヤーがいるかもしれないね。

利益が出ないせいで全部崩壊することを考えるのは無駄だよ、明らかじゃん。

続けるには、続けることが大事だよね。みんな最新のSNSのゴシップやニュース、テレビ番組、興味のあることを追いかけてる。とにかく、ずっとそれを続ける感じ。週末はKimi K2を走らせて、ここ2日間はErnie4.5-300Bを運転してた。今朝最新のQwen3-235bをダウンロードして、今夜使い始めたところ。今夜は480Bのダウンロードも始めるつもり。クソみたいなネット環境だから2〜3日かかるかもだけど、その後に取り掛かるよ。これって、もしかして執着?

GroqかCerebrasで高速なバイブコーディングができるのを待ってるよ。

これって、エージェントの指示用にリポジトリにQWEN.mdを追加することを提案してるね。AGENTS.mdはどうなってるの?チームのリポジトリで、エージェントごとに重複したマークダウンファイルがあるのはちょっとおかしいよね。