世界を動かす技術を、日本語で。

セレブラスコード

概要

  • CerebrasがAIコーディングを高速・手軽にする新プランを発表
  • Qwen3-Coder搭載で最大2,000トークン/秒の超高速生成
  • 独自IDE不要、OpenAI互換エンドポイント対応
  • 2つの料金プラン(Pro/Max)で用途に合わせて選択可能
  • 即日利用開始、待機リスト不要

Cerebrasの新AIコーディングプラン概要

  • Cerebras Code Pro($50/月)Code Max($200/月) の2種類を新たに提供
  • Qwen3-Coder 搭載:世界最先端のオープンウェイトコーディングモデル
  • 最大 2,000トークン/秒 の高速生成速度
  • 131kトークン の広大なコンテキストウィンドウ
  • 独自IDEへのロックインなし、週ごとの利用制限なし
  • OpenAI互換エンドポイント 対応:既存のエディタやツールと簡単連携
    • Cursor、Continue.dev、Cline、RooCode などにすぐ接続可能
  • 追加設定不要、既存ワークフローへの即時導入可能

Qwen3-Coderの特徴

  • Alibaba が開発したフラッグシップコーディングエージェントモデル
  • 480Bパラメータ を持つ大規模モデル
  • Claude Sonnet 4やGPT-4.1 に匹敵するコーディング・エージェントタスク性能
  • Agentic Coding、Agentic Browser-Use、BFCL など主要ベンチマークでトップクラスの実績

プラン詳細と用途

  • Cerebras Code Pro($50/月)

    • Qwen3-Coderへのアクセスと高速・高コンテキスト生成
    • 1日最大 1,000メッセージ 送信可能(3~4時間の連続コーディングに最適)
    • 個人開発者、単純なエージェントワークフロー、週末プロジェクト 向け
  • Cerebras Code Max($200/月)

    • Qwen3-Coderへのアクセスと大規模ワークフロー対応
    • 1日最大 5,000メッセージ 送信可能
    • フルタイム開発、IDE統合、大規模コードリファクタリング、マルチエージェントシステム 向け

利用開始方法

  • 即日利用可能、待機リスト不要
  • サインアップ後、 APIキー をお気に入りのエディタに入力するだけで利用開始
  • 高速・高品質なコード生成 をすぐに体験可能

まとめ

  • Cerebras Code Pro/Max は、AIコーディングの生産性と自由度を一気に向上
  • 先端モデルQwen3-Coder による圧倒的なパフォーマンス
  • 柔軟なワークフロー統合 で、すべての開発者に新しいコーディング体験を提供

Hackerたちの意見

もっとサブスクリプション型のサービスが出てきて、影響力のあるプロバイダーと競争するのを待ってたんだ。これからもっと多くの会社が参入して、競争が激しくなれば、ユーザーにとって価格も良くなると思う。Cerebrasチームのローンチ、おめでとう!

claude-code-routerと連携するの?今週、OpenRouterを使ってqwen3 Cerebrasを試したらAPIエラーが出たんだよね。

APIエラー: 422 {"error":{"message":"プロバイダーからのエラー: {"message":"body.messages.0.system.content: 入力は有効な文字列である必要があります","type":"invalid_request_error","param":"validation_error","code":"wrong_api_format"}

Qwen3の人たちが、KimiやGLM/Zaiの人たちみたいにAnthropic互換のAPIを作ってくれたらいいのに。これで彼らのモデルがClaude Codeで簡単に使えるようになるんだよね。この超簡単なセットアップで: https://github.com/pchalasani/claude-code-tools?tab=readme-o...

1秒あたり最大2,000トークンの速度で動作し、131kトークンのコンテキストウィンドウ、専用IDEのロックインなし、週ごとの制限もなし!すごくワクワクしたけど、これを読んでちょっと冷めた。> 1日に最大1,000メッセージを送信可能—これは3〜4時間の中断なしのコーディングに十分な量だね。自分が使うサービスにはお金を払ってもいいけど、最初の段落の主張が細かい条件と矛盾してると、真剣に受け止めるのは難しいよね。

それはclaude codeの週ごとの制限からの区別だね。

1日に1,000メッセージあれば、日常の開発には十分だと思う。私はclaude code sonnet 4を専ら使ってるけど、1日に1,000メッセージ以上送ることはないよ。ただ、これが今の私の理解なんだけど、1,000回エンターを押してるわけじゃないしね!もしかしたら、気づかないうちにもっとメッセージが送られてるのかな?

これがあるのは、これ[1]が彼らに起こるのを防ぐためだと思う。[1] https://www.viberank.app/

それは本当のことだよ。週ごとの制限はなくて、日ごとの制限だけ。ツールから23時間59分だけロックアウトされるのは、扱いやすいね。

これを考えると、GitHub Copilotのビジネスライセンスは月に300回の「プレミアム」リクエストができるんだ。

Claude Codeに対する本当の競争相手が出てきて、すごくワクワクしてる!Gemini CLIはまあまあだけど、月額200ドルのプランはないし、APIアクセスごとに料金がかかるんだ。Codexも同じだし。$50/月のプランを試すためにhttps://cloud.cerebras.ai/に入ろうとしてるけど、全然入れないんだよね。

何か勘違いしてるかもしれないけど、Cerebras CodeはClaude CodeやGemini CLIと同じじゃないよ。APIエンドポイントにアクセスするためのサブスクリプションとしては変な名前だと思う。Cerebras Codeのエンドポイントを取って、XYZ CLIツールやIDEプラグインをそれに向けて設定する感じだね。

これ、競合って感じじゃないな。Ampはそうだけど。

2,000トークン/秒はヤバいね。バイブコーディングには反対だけど、そんなパフォーマンスなら、ほぼGitHub Copilot並みの速度が得られて、質も格段に良くなるってことだよね。エディタ内での使用には革命的だよ。

コーディングエージェントでこれを試してみたいなら(qwen3-coderモデルがエージェントでめっちゃいい感じに動くよ!)、Cerebras CodeをSketchで試してるんだ。サポートを追加したばかりだから、最新バージョン0.0.33で動かせるよ:brew install boldsoftware/tap/sketch CEREBRAS_API_KEY=... sketch --model=qwen3-coder-cerebras -skaband-addr=。今のところ、ちょっと負荷がかかってるみたいで、いつものホスティング版の方が結果が良かったりする:sketch --model=qwen。

彼らのハードウェアはすごいよね。こんな環境で、なんでもっと投資家が並ばないのかな?

矛盾は存在しない。矛盾に直面していると思ったら、前提を確認してみて。どれかが間違っていることに気づくはずだよ。

自分のAPIキーを使ってClineでこれを試してみたんだけど(CerebrasはQwen3 Coderのプロバイダーとしても使えるよ、ここで: https://openrouter.ai/qwen/qwen3-coder)、キャッシュなしだとすぐに高くつくことに気づいた。具体的には、新しいツールを呼び出すたびに、前のメッセージ履歴全体を入力トークンとして送信してるから、API経由で出力トークンと同じく$2/1Mの料金がかかる。質はClaude Codeがくれたものほどではないけど、スピードは確実に速い。もしCerebrasがキャッシュをサポートして、キャッシュ使用時のトークン価格を下げてくれたら、もっと使うと思うけど、今はエージェントごとのコストが高すぎる。

これはトークンじゃなくてメッセージで制限されてるみたいだから、キャッシュがないことはあんまり関係ないかもね。

コンテキストウィンドウにファイル全体を追加してAIに処理させるのは、すごく無駄なアプローチだよね。AIでdiffを生成しようとすると新たな問題が出てくるから、そうなったんだろうけど、もっと効率的な方法があるんだ。シンボルレベルでファイルをスライスするのがそれ。だから、AIがfoo()の宣言とbar()の定義だけ必要なら、ファイル全体をこんな風にまとめられるんだ: class MyClass { void foo(); void bar() { //コード } } AIが提案する変更は簡単にマージできるし(リネームだけが特例だけど)、すごく速く動くよ。今、このアプローチを使って、編集の前後に行き来できるエディタを作ってるんだけど、すごくうまくいってる。Cerebrasプラットフォームが大好きだよ(無料プランがあって、OpenRouter経由で従量課金もある)。単文のプロンプトで1、2秒でリファクタリングができるのはすごくイライラするけど、トークンでのリファクタリングはだいたい半セントくらいかかる。データ構造を広げるために既知のアルゴリズムを適用するのにも最適で、すべてのファイルを含めるとコンテキストウィンドウが潰れちゃうけど、個別のタイプを引っ張るだけでトークンの一部で済むんだ。宣伝になっちゃうけど、詳しい説明はここにあるよ: https://sysprogs.com/CodeVROOM/documentation/concepts/symbol...

チャットGPTやT3チャット、DeepSeek、Claude Codeなどのサブスクリプションを行ったり来たりしてる。彼らのサブスクリプションモデルは、データを持ち運ぶのを簡単にするのに向いてないんだよね。これを試してみて、すべてのデータをインポートできたらいいのに。

注意: Cerebras コード内の "" を扱おうとすると、"" に置き換わっちゃう。inference.cerebras.aiのチャットとAPIの両方でそうなる。同じモデルのchat.qwen.aiではそうならないけど。