世界を動かす技術を、日本語で。

ミストラルが「ル・シャ」内でディープリサーチ、ボイス、プロジェクトを発表

概要

Le Chatが 新機能 を搭載し、 直感的で多機能 なAIアシスタントへ進化。 Deep Research音声モード など、研究・表現・整理がさらに容易。 多言語推論画像編集 も強化され、利用シーンが拡大。 Projects機能 で会話や資料を一元管理。 すべての新機能は chat.mistral.ai やアプリで利用可能。

Le Chatの新機能概要

  • Deep Researchモード による複雑なテーマの高速・構造化レポート生成
  • Voiceモード(Voxtral搭載) でキーボード不要の自然な会話体験
  • 多言語推論(Magistral搭載) で多様な言語での思考整理と表現
  • Projects機能 による会話・資料・設定のコンテキスト管理
  • Black Forest Labs提携の画像編集 で直感的な画像加工と一貫性維持

Deep Researchモード

  • 計画立案・ニーズ明確化・検索・要約 を自動化する研究アシスタント
  • 信頼できる情報源を収集し、 構造化されたレポート を生成
  • 参考文献付き で分かりやすいドキュメント作成
  • 複雑な質問の分解 と整理されたアウトプット

Voiceモード(Voxtral)

  • 会話型インターフェース で話しかけるだけの操作性
  • 低遅延・自然な音声認識 によるスムーズな対話
  • アイデア出し・クイックな質問・議事録作成 など多様な用途

多言語推論(Magistral)

  • スペイン語での提案書作成日本語での法的概念の明確化 など多言語対応
  • 文中での言語切り替え も可能な柔軟性
  • 明確で深い回答 による複雑な思考のサポート

Projects機能

  • 関連チャットをプロジェクト単位で整理 し、文脈を維持
  • 独自のライブラリ・設定記憶 による作業環境の最適化
  • ファイルアップロードやライブラリ連携 による一元管理
  • 長期プロジェクト・アイデア管理・製品設計 などに最適

画像編集機能

  • テキストプロンプトによる画像生成・編集 が可能
  • 「オブジェクトを削除」「別の都市に配置」など 直感的な操作
  • 人物・デザイン要素の一貫性維持 でシリーズ編集も容易

利用方法・問い合わせ・採用情報

  • chat.mistral.ai または App Store/Play Store で全機能を無料体験
  • クレジットカード不要 で即利用可能
  • Le Chat Enterprise で組織のAI活用を支援
  • 採用募集中、世界水準のAIプロダクト開発への参加歓迎

Hackerたちの意見

例はあんまり良くないね。例えば、個人のプランニングのやつは、深いリサーチなしでもプロンプトに対していい答えを出してるよ(ビザのポイントだけの回答だけど)。

MRFに苦しんでる。モデルリリース疲れってやつ。新しい大きなモデルに常に切り替えるのが辛い。Claude 4、GPT、Llama、Gemini 2.5、Pro-mini、Mistrial。アイデアを思いついてモデルを切り替えると、「ああ、これの方がいいな」って思うけど、前に使ってたやつに戻すと、「あれ、これ今はダメだな」ってなる。コンテキストスイッチング、モデルリリース疲れ。

前のバージョンのパフォーマンスが悪くなってるのは、プロバイダーが新しいバージョンにリソースを再配分するからだと思う。それに、トレーニングデータのカットオフが前の年にあるからね。これがClaude Sonnet 3.5と3.7の間で起こったこと。個人的には、Claude/Anthropicだけを使ってて、他のプロバイダーは無視してる。理由は、そっちの方が理解しやすいから。十分賢いし、最新のものはあんまり必要ない。

なんでそんなにフォローしてるの?自分に合ったやつだけ使えばいいじゃん?

なんて贅沢なんだ!これを避ける一つの方法は、一つのLLMに絞って、その背後の会社に賭けることだね(つまり、時間が経つにつれて、彼らが常に最高の提供をしてくれるってこと)。私はOpenAIに賭けてる。他の人は違う結論を出すかもしれないけど。

めっちゃ分かる。仕事の関係で新しいモデルのリリースにはついていってるけど、個人や業界にとってこのペースは持続不可能だよね。LLMが成熟して、モデルのトレーニングでの簡単な部分がほとんど終わったら、リリースのペース(そしてこの分野全体の開発スピード)が少し落ち着くことを願ってる。もうその時は来てるのかな? まだまだだよね。

これらのことをあまり試してない大きな理由だね(なんとなく面白いとは思ってるけど)。2026年の後半まで待つつもりかな。少なくとも、その頃にはローカルモデルやそれをうまく動かせるハードウェアがあるかチェックするつもり。初期のバージョンに取り組む人たちには敬意を表するよ。

疲れを感じる気持ちは否定しないけど、市場に選択肢がたくさんあって、そこそこ革新が進んでるのは嬉しいよね。もし常にベストな選択肢を使おうと思ったら、色々大変だろうけど、停滞や独占よりはマシだよ。

代替案として、LLMを使わないってのもありだよ。効率を上げることより、コーディングを楽しむことに集中した方がいい。効率が上がって得られる利益の大部分は、主にCEOたちに行ってるからね。

競争があるのは素晴らしいと思う。プレミアムモデルをいつも使ってるけど、ほんの数ユーロしか使ってないよ。ちょっと探せばほぼ無料のオファーがいつもあるからね。

新しいコンピュータハードウェアと同じで、発表は常にあるけど、あんまり心惹かれないんだよね。普通のユーザーが去年のトップ3の選択肢を選んで、それを今まで使ってたなら、特に最新のものじゃなくてもそんなに損してないと思うよ。

誰かモデルのパフォーマンスについてオンラインレビューしてる人いる?(人工分析がインフラについての仕事をしてるのは知ってるし、インテリジェンスインデックスもあるよね)

集計された情報だけじゃ限界があるよね。simonwillison.net/2025/jul/みたいなサイトや、https://www.youtube.com/@aiexplained-officialみたいなチャンネルも、新しいモデルのリリースをかなり早くカバーしてるし、「型破りな思考/推論」の評価もしてるよ。私の場合、新しいモデルを実際に使うタスクで使ってみないと、本当に効果がわからない。私の個人的なベンチマーク、andrew.ginns.uk/merbenchには、GitHubにフルコードとデータがあるから、スタート地点にしたい人はどうぞ!

そうだね、GosuCoderは面白いよね。 https://youtu.be/064VC2gFIGY?si=l0LVtUttVrbiBZ3K

今のところ、AI業界全体がほとんどOpenAIをコピーしてる気がする。違う会社が同じサービスを提供してるってことに気づかざるを得ない。実際、このビルドの革新性はそんなに高くないよ。

これが自由市場における健全な競争の姿だね。何十年も「革新を続ける」Appleみたいなのは、独占的なゲートキーピングによる異常だよ。

同じサービスじゃないよ。実際にコーディングみたいな日常的なタスクでモデルを使うと、提供されるものにはめちゃくちゃ違いがあるからね。

基本的にはどこでも同じ技術だよ。トレーニングデータや計算能力に違いがあるかもしれないけど。

現時点では、AI業界全体がほとんどOpenAIをコピーしているように見える まあ、OpenAIはGoogleからDeep Researchの機能をコピーしたんだよね。名前も同じだし(Mistralもそう)。

今や全世界が f(input: string): string 関数の上に何かを作ってるから、似たようなものになるだろうね。

Voxtralのリリースは面白そうだったね。競争的なオープンソースの音声転写が戻ってきたから。ただ、LLMのバックボーンが必要だったのか(純粋な関数モデルと比べて)気になるけど、そのアプローチは興味深いよ。

競争力のあるオープンソースの音声転写が復活したんだ。 Mistralのプレスリリースは、強力なオープンなSTTモデルと比較してないから、まるでWhisper以来の最高の新しいものみたいな印象を与えてるけど、実際にはそうじゃないよ。オープンなベンチマークがここにあるよ: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard 。Mistralが比較した中で一番強いモデルはScribeで、ここでは10位だね。このベンチマークは英語用だけど、いくつかのモデルは多言語対応だよ(例えば https://huggingface.co/nvidia/canary-1b-flash )。

彼らは画像編集機能のことをあまり強調してないと思うけど、これがすごく良さそうだよ!OpenAIのモデルは、編集中に関係ない部分の詳細を壊しながら画像全体を変えちゃうけど、これは関係ない部分を完璧に保ちながら、選択的に編集を適用してるみたいで、めっちゃ印象的だね!唯一の欠点は出力解像度で、結果の画像は1184px幅で、入力画像はもっと大きかったのにね。ちょっとしたテストで自宅のオフィスの写真をアップロードして、「下の少し破れた灰色のパネルを修正して、新品みたいに見せて」って頼んだんだ。入力画像(リスケール済み): https://i.imgur.com/t0WCKAu.jpeg 出力画像: https://i.imgur.com/xb99lmC.png すごく良い仕上がりだと思う。出力画像の品質は元のものよりほんの少し劣るけど、これは時間が経てば改善されると思うよ。

ちなみに、入力と出力のURLが同じだよ(違いを探そうとして一瞬狂ったかと思った)。

彼らはBlack Forest LabsのFlux Kontextを使ってるんだ、素晴らしいモデルだよ。

Kontextはこの特定のタスクには多分向いてると思う、もしMistralがそれを使ってるなら。確実に速くて安いし。ただ、OpenAIは昨日、彼らのモデルで高精度な画像編集ができる機能を追加したんだって[1]。でも、その機能がAPIだけなのか、チャットUIでも使えるのかは分からない。同じプロンプトと入力画像で: [2] [1] https://x.com/OpenAIDevs/status/1945538534884135132 [2] https://i.imgur.com/w5Q0UQm.png

それが必要だな。

それが必要だったんだ。今は手に入ったよ :)

OpenAIのディープリサーチ機能を試してないなら、損してるよ。いい代替品があるか分からないけど、Googleのは試したけど、あんまり感動しなかった。エンジニアがこういうツールを使ってトレードオフスタディをするのは、すごく価値があると思う。

Kimi 2のも試してみて。意外と良かったから驚いたよ。

ビジネスを始めるための市場調査には、すごく役立ってる。まるで明るい新入社員のリサーチアシスタントやプロダクトマネージャーが「スタッフ」として一緒に働いてるみたい。

Perplexitiesは悪くない?ただ、比較するためのOpenAIのサブスクリプションがないから分からないけど。

OpenAIとGeminiでかなり違う結果が出たけど、どちらが良いか悪いかは言いづらいね。ただ単に違うって感じ。

Anthropicのリサーチはかなり良いと思う。OpenAIと同じくらいかな。Googleについては同意するけど、有料版の方が精度はちょっと良いけど、レポートは読むのがイライラするくらい長いね。まるで学部生がレポートの文字数を増やすために無駄に膨らませてるみたい。

昔は、La Chatはラッパーだったんだよ、ラッパーじゃなくてラッパーの方ね。

実は「Le Chat」はフランス語でオスの猫を意味するんだ。あと、「Le Chat」はドイツのヘンケル社の有名な洗剤でもある。見出しの「Le Chat takes a deep dive」は「猫が深く飛び込む」って意味なんだけど、ドイツのブラックフォレストラボと提携してるから、フランス語を話す人にとってはかなり面白いよ。「La Chatte」はメスの猫のこと。あと、女性のプライベートな部分を指す言葉でもあるんだ。