概要
Mistral OCR 4 は、170言語対応の高精度OCRモデル。 バウンディングボックス ・ブロック分類・信頼度スコアを抽出テキストと共に提供。 自己ホスティング 可能な軽量設計で、エンタープライズ用途やRAG等のパイプラインに最適。 ベンチマークで高評価 を獲得し、他社製品より高速・低コスト・高精度を実現。 APIおよびDocument AI 経由で利用可能、用途に応じた柔軟な導入が可能。
Mistral OCR 4の新機能と特徴
- バウンディングボックス によるテキスト位置特定機能の追加
- ブロック分類 (タイトル・表・数式・署名等)と インライン信頼度スコア の出力
- 170言語・10言語グループ への対応
- レア言語や低リソース言語でも高精度維持
- 単一コンテナ で自己ホスティング可能な軽量モデル
- エンタープライズ検索・RAG・ドメイン特化型リトリーバル 用インジェストコンポーネントとして利用
- Mistral Search Toolkit との統合(パブリックプレビュー)
- PDF・DOC・PPT・OpenDocument 等、主要エンタープライズ文書形式に対応
- API経由での導入、または Mistral StudioのDocument AI でノーコード利用
パフォーマンスとベンチマーク
- 独立評価者による比較テスト で主要OCR/ドキュメントAIシステムを上回る
- Win rate平均 72%
- OlmOCRBench で最高スコア 85.20
- OmniDocBench で 93.07 (注:スコア算出方法に既知の制限あり)
- 内部多言語評価 で全8言語グループ中トップ(特にレア言語で優位性)
- 高速処理 :既存プロバイダ比で 約4倍高速・8倍低コスト・17倍低遅延
- ベンチマークの限界 :アノテーションミスや数式の表現違い等により、正しい出力が過小評価される場合あり
- 人手評価 重視の現実的な性能測定
推奨ユースケース
- 複雑・多言語文書の解析・抽出
- RAG(Retrieval-Augmented Generation) :構造化・分類済み・引用可能なコンテンツ生成
- Search Toolkitとの連携でリトリーバルパイプラインに直接投入
- エージェントワークフロー :フォーム入力・請求書処理・コンプライアンスチェック等
- 信頼度スコア活用の構造化データパイプライン :人による検証・レダクション・法令遵守プロセス
- エンタープライズ検索・ナレッジベース :カスタムインジェスト・エンティティ抽出データソース
- 事例 :請求書の構造化フィールド化、企業アーカイブのデジタル化、技術・科学レポートのテキスト抽出、エンタープライズ検索
利用上の注意(アウトオブスコープ)
- 意思決定用途非推奨
- 医療診断・法的助言・高リスク金融判断・安全クリティカルシステム・リアルタイム/低遅延用途・非文書データ(音声・動画等)は対象外
APIおよびDocument AI活用ガイド
- OCR 4 API :単一エンドポイントで全機能利用可能
- 生データ抽出 :アプリ・エージェント・データパイプラインへの組み込み
- バッチAPI :高スループット・低コスト運用
- 自己ホスト :データプライバシー・主権・コンプライアンス要件対応
- Document AIパラメータ追加時 :
- カスタムJSONスキーマ による構造化出力
- 画像アノテーション :画像ごとにビジョン・ランゲージモデルを追加実行
- プロンプト&スキーマ :抽出内容のカスタム解釈や要約
- ノーコード構造化出力 :ビジネスユーザーやソリューションチーム向け
- 実用的な選択基準 :
- 生データが必要な場合 はOCR 4そのまま
- 出力の構造化やカスタム要件 が必要な場合はDocument AIパラメータ追加
価格・提供チャネル
- OCR 4 API : $4/1,000ページ (バッチAPI利用時は $2/1,000ページ)
- Document AI : $5/1,000ページ
- 提供先 :
- Mistral Studio (API)
- Amazon SageMaker
- Microsoft Foundry
- Snowflake Parse Document (近日対応予定)
- 自己ホスティング :厳格なデータプライバシー要件対応
今後の展望・パートナーシップ
- Microsoft Foundry 等との連携によるエンタープライズ向けワークフロー強化
- 自己ホストオプション で機密情報の社内完結処理を実現
- 継続的な機能拡張・新規連携 予定
Mistral OCR 4 は、 高精度・多言語対応・自己ホスティング可能 な次世代OCR基盤として、エンタープライズ文書処理や知識検索、RAG、構造化データ抽出の現場で幅広く活用可能。 用途や要件に応じてAPI/Document AIを柔軟に使い分け、自社ワークフローに最適な形で導入が可能。