ミストラルOCR 4

2026年6月23日原文(mistral.ai)

概要

Mistral OCR 4 は、170言語対応の高精度OCRモデル。 バウンディングボックス ・ブロック分類・信頼度スコアを抽出テキストと共に提供。 自己ホスティング 可能な軽量設計で、エンタープライズ用途やRAG等のパイプラインに最適。 ベンチマークで高評価 を獲得し、他社製品より高速・低コスト・高精度を実現。 APIおよびDocument AI 経由で利用可能、用途に応じた柔軟な導入が可能。

Mistral OCR 4の新機能と特徴

バウンディングボックス によるテキスト位置特定機能の追加
ブロック分類 （タイトル・表・数式・署名等）と インライン信頼度スコア の出力
170言語・10言語グループ への対応
- レア言語や低リソース言語でも高精度維持
単一コンテナ で自己ホスティング可能な軽量モデル
エンタープライズ検索・RAG・ドメイン特化型リトリーバル 用インジェストコンポーネントとして利用
Mistral Search Toolkit との統合（パブリックプレビュー）
PDF・DOC・PPT・OpenDocument 等、主要エンタープライズ文書形式に対応
API経由での導入、または Mistral StudioのDocument AI でノーコード利用

パフォーマンスとベンチマーク

独立評価者による比較テスト で主要OCR/ドキュメントAIシステムを上回る
- Win rate平均 72%
- OlmOCRBench で最高スコア 85.20
- OmniDocBench で 93.07 （注：スコア算出方法に既知の制限あり）
内部多言語評価 で全8言語グループ中トップ（特にレア言語で優位性）
高速処理 ：既存プロバイダ比で 約4倍高速・8倍低コスト・17倍低遅延
ベンチマークの限界 ：アノテーションミスや数式の表現違い等により、正しい出力が過小評価される場合あり
人手評価 重視の現実的な性能測定

推奨ユースケース

複雑・多言語文書の解析・抽出
RAG（Retrieval-Augmented Generation） ：構造化・分類済み・引用可能なコンテンツ生成
- Search Toolkitとの連携でリトリーバルパイプラインに直接投入
エージェントワークフロー ：フォーム入力・請求書処理・コンプライアンスチェック等
信頼度スコア活用の構造化データパイプライン ：人による検証・レダクション・法令遵守プロセス
エンタープライズ検索・ナレッジベース ：カスタムインジェスト・エンティティ抽出データソース
事例：請求書の構造化フィールド化、企業アーカイブのデジタル化、技術・科学レポートのテキスト抽出、エンタープライズ検索

利用上の注意（アウトオブスコープ）

意思決定用途非推奨
- 医療診断・法的助言・高リスク金融判断・安全クリティカルシステム・リアルタイム/低遅延用途・非文書データ（音声・動画等）は対象外

APIおよびDocument AI活用ガイド

OCR 4 API ：単一エンドポイントで全機能利用可能
- 生データ抽出 ：アプリ・エージェント・データパイプラインへの組み込み
- バッチAPI ：高スループット・低コスト運用
- 自己ホスト ：データプライバシー・主権・コンプライアンス要件対応
Document AIパラメータ追加時 ：
- カスタムJSONスキーマ による構造化出力
- 画像アノテーション ：画像ごとにビジョン・ランゲージモデルを追加実行
- プロンプト＆スキーマ ：抽出内容のカスタム解釈や要約
- ノーコード構造化出力 ：ビジネスユーザーやソリューションチーム向け
実用的な選択基準 ：
- 生データが必要な場合 はOCR 4そのまま
- 出力の構造化やカスタム要件 が必要な場合はDocument AIパラメータ追加

価格・提供チャネル

OCR 4 API ： $4/1,000ページ （バッチAPI利用時は $2/1,000ページ）
Document AI ： $5/1,000ページ
提供先 ：
- Mistral Studio （API）
- Amazon SageMaker
- Microsoft Foundry
- Snowflake Parse Document （近日対応予定）
- 自己ホスティング ：厳格なデータプライバシー要件対応

今後の展望・パートナーシップ

Microsoft Foundry 等との連携によるエンタープライズ向けワークフロー強化
自己ホストオプション で機密情報の社内完結処理を実現
継続的な機能拡張・新規連携 予定

Mistral OCR 4 は、 高精度・多言語対応・自己ホスティング可能 な次世代OCR基盤として、エンタープライズ文書処理や知識検索、RAG、構造化データ抽出の現場で幅広く活用可能。 用途や要件に応じてAPI/Document AIを柔軟に使い分け、自社ワークフローに最適な形で導入が可能。

ハクソク