ミストラル・ミディアム 3.5

2026年4月30日原文(mistral.ai)

概要

Mistral Medium 3.5 搭載の新しいクラウドエージェントの登場
Mistral Vibe や Le Chat から非同期でコーディングタスクを実行可能
Workモード により複雑なマルチステップ作業も自動化
モデルは 公開ウェイト・MITライセンス で提供
API・クラウド・自社ホスト で柔軟に利用可能

クラウドエージェントによるコーディングの新時代

コーディングエージェントが従来のローカルPCから クラウド へ移行
エージェントは 独立して並列実行 し、完了時に通知
Mistral Vibe CLI や Le Chat から直接タスク開始
チャットから離れずにコーディング依頼が可能なワークフロー

Mistral Medium 3.5モデルの特徴

命令追従・推論・コーディング を統合した 128B密結合モデル
256kコンテキストウィンドウ 対応で長時間作業や大規模文脈処理に最適
4枚のGPU で自社ホスト可能な省リソース設計
SWE-Bench Verified 77.6%、 τ³-Telecom 91.4 の高スコア達成
公開ウェイト はHugging Faceで 修正版MITライセンス 下に提供

Vibeリモートエージェントの進化

長時間タスク をクラウド上で実行し、ユーザーの手を煩わせない
並列実行 により複数の作業を同時進行
CLIやLe Chat からエージェント起動、ローカルセッションの クラウド転送 も可能
ファイル差分・ツール呼び出し・進捗状況 を逐次確認
GitHub・Linear・Jira・Sentry・Slack・Teams など主要ツールと連携
完了時は GitHubのプルリクエスト作成 や通知で効率化

Le Chatの新Workモード（プレビュー）

Mistral Medium 3.5 搭載の新エージェントによる 複雑なマルチステップ作業 の自動化
メール・カレンダー・Slack 等を横断した クロスツールワークフロー
リサーチ・要約・レポート作成 等も自動実行
セッションは 長時間持続 し、試行錯誤や複数ターンに対応
コネクタ自動有効化 で幅広い情報源から文脈取得
全アクションの可視化 と ユーザー承認 による安全性確保

利用方法・料金・提供形態

Mistral Vibe と Le Chat で即日利用可能
Pro・Team・Enterprise プランでWorkモード利用
API価格 ：入力100万トークンあたり$1.5、出力100万トークンあたり$7.5
Hugging Face でオープンウェイト配布、 NVIDIA build.nvidia.com や NIM にも対応
研究・エンジニアリング・プロダクト 分野で採用募集中

Hackerたちの意見

まあまあかな、特別ってわけじゃないけど、アメリカや中国以外のモデルのニュースはやっぱり嬉しいね。

└

これがヨーロッパの基準ってこと？

このMistralのリリースは、フロンティアラボと他のモデルとのギャップをすごく感じさせるね。プレエージェントの頃は、モデル間の違いがあまり明確じゃなかったけど、今はフロンティアモデル以外は考えたくない。能力の差がすごく大きいし、劣るものを選ぶと生産性に実際に影響が出るからね。Mistralや特にCohereみたいな小さいラボのファンなんだけど、最近はどちらの会社のリリースにもあまりワクワクしてないな。でも、Mistral Voxtralをリアルタイムで毎日使ってるけど、これはめっちゃいいよ。

└

プレエージェントの頃は、モデル間の違いがあまり明確じゃなかった。いろんなモデルにはそれぞれの魅力があったけど、今はフロンティアモデル以外は考えたくない。能力の差がすごく大きいし、劣るものを選ぶと生産性に実際に影響が出る。これはもうリンゴとオレンジの違いだよ。Gemini、ChatGPT、Claudeの非エージェントタスクでの勝者は明確じゃないけど、Claude CodeはCodexよりもかなり良くて、CodexはGemini-cliよりも明らかに優れてる。この流れで言うと、Claude Codeが非フロンティアモデルよりもエージェントコーディングで遥かに優れているのは驚くことじゃないよ… 特殊なエージェントタスクでは他のフロンティアモデルよりもかなり良いからね。

└

プレエージェントの頃は、モデル間の違いがあまり明確じゃなかった。いろんなモデルにはそれぞれの魅力があったけど、今はフロンティアモデル以外は考えたくない。これは非常にナイーブで誤った意見だと思う。ほとんどのタスク、特に複雑なコーディングタスクでは、フロンティアモデルとGPT4.1のようなモデルの違いはほとんどわからないよ。コンテキストウィンドウやツール呼び出し、推論ステップの特定の側面に本当に集中しないと違いに気づかない。さらに悪いことに、フロンティアモデルは結果を出すために brute force のアプローチを取っていて、そのせいで運用コストがかなり高くなってる。請求書に載る金額もそうだし、出力が得られるまでの待ち時間も長くなる。ローカルモデルの話はしないけど。

└

全然同意できない。1年前の生産性のギャップは、フロンティアモデルと非フロンティアモデルの間でずっと大きかったよ。2年前なんて言わずもがな。

いつも応援してるよ！モデルと国の多様性は素晴らしいね。これはしっかりした基盤になりそうだし、3.6/3.7でさらに良くなることを期待してる。コンピュータ使用のベンチマークから見ると、ビジョンパイプラインに改善の余地があるかもしれないけど、あくまで推測だね。いくつかのベンチマークの結果が、これは本当に独立して訓練されたモデルなんじゃないかって感じさせる。フロンティアのログをそのまま使っただけじゃないってことが大事だと思う。特定のモデル内に異なる重みのアーキテクチャがあるのは、グローバルなシステムアーキテクチャの観点から見ると自体が利点になる気がする。

これが公式のMistral APIで利用可能かどうかわからない。彼らのモデルリストAPIはこれを返してる：{ "id": "mistral-medium-2508", "object": "model", "created": 1777479384, "owned_by": "mistralai", "capabilities": { "completion_chat": true, "function_calling": true, "reasoning": false, "completion_fim": false, "fine_tuning": true, "vision": true, "ocr": false, "classification": false, "moderation": false, "audio": false, "audio_transcription": false, "audio_transcription_realtime": false, "audio_speech": false }, "name": "mistral-medium-2508", "description": "Update on Mistral Medium 3 with improved capabilities.", "max_context_length": 131072, "aliases": [ "mistral-medium-latest", "mistral-medium", "mistral-vibe-cli-with-tools" ], "deprecation": null, "deprecation_replacement_model": null, "default_model_temperature": 0.3, "type": "base" }、だから「mistral-medium-latest」ってエイリアスがあるけど、公式IDは「mistral-medium-2508」で、これは2025年8月にリリースされたモデルを示唆してる。でも…その1777479384のタイムスタンプは、2026年4月29日水曜日の午後4時16分24秒UTCにデコードされる。これが新しいMistral Mediumなのかな？

└

https://github.com/mistralai/mistral-vibe のソースコードをちょっといじってみたら、これが出てきたよ： curl https://api.mistral.ai/v1/chat/completions
-H "Content-Type: application/json"
-H "Authorization: Bearer $(llm keys get mistral)"
-d '{ "model": "mistral-medium-3.5", "messages": [ {"role": "user", "content": "Generate an SVG of a pelican riding a bicycle"} ] }' これがちゃんと動いたけど、ちょっとがっかり。モデルリストに出てこないのが変だね： curl https://api.mistral.ai/v1/models
-H "Content-Type: application/json"
-H "Authorization: Bearer $(llm keys get mistral)" | jq

128Bが今やミディアムと見なされるのが面白いよね。昔は355Mパラメータがミディアムって言われてたのを覚えてる。

└

GPT-2の1.5Bはリリースするには危険すぎると見なされてた。彼らは多分正しかったね。

コメント欄の人たちが何を言ってるのかよくわからない。確かに他のモデルには勝てないけど、サイズにしては頑張ってると思う。GLM 5.1は優れたモデルだけど、Q4だと約400GB必要だし。Kimi K2.5もすごく良いし、Q4量子化だとほぼ600GB。で、このモデルは？Q4で70GBのVRAMで動かせるよ。これって消費者レベルに近づいてるね（128GBのRAMを搭載したMac Studioが約3500ドルで買えるし）。Claude派の人たちにはわからないけど、Opusだけを使ってるのかな？私がProプランの時、Sonnetはすでにかなり優秀だったよ。これがローカルで動いて、HERMES.mdがリポジトリにあっても余計な料金を取られたり、気まぐれでアカウントをロックされたりしないのはいいね。Mistralはフロンティアでは競争力がなかったけど、もしかしたらそれが彼らに求められていることじゃないのかも。コストやサイズの20%でフロンティアの80%を得られるParetoモデルって、すごく良さそうだと思う。

Hacker Newsで議論の続きを見る

ハクソク