Mistral AI推出OCR 4文档识别模型:支持170种语言,输出质量超越GPT与Gemini
6月26日,法国人工智能初创企业Mistral AI于当地时间6月23日宣布推出其最新文档内容识别模型OCR 4。该模型定位于高效的企业级文档处理工具,在输出文本的同时还可提供边框定位、区域分类和置信度评分,为RAG语义分块、智能体结构化处理及企业搜索等下游任务提供精准的数据支撑。
据官方披露,OCR 4模型支持横跨10个语族的170种语言,在OmniDocBench基准测试中取得93.07分。在人类评审偏好测试中,该模型的输出相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受青睐,胜率分别达到66.4%和70%。在独立基准测试OlmOCRBench中,OCR 4也以85.20的综合评分位居领先地位。
作为一款轻量化的专精模型,OCR 4支持PDF、DOC、PPT及OpenDocument等常见企业文档格式,可部署于单个容器内运行,支持企业完全自托管以满足数据主权与合规性要求。Mistral AI表示,OCR 4已集成至Mistral Search Toolkit预览版,可通过Mistral Studio、Amazon SageMaker及Microsoft Foundry等渠道接入。API调用定价为每千页4美元,批处理方式可享50%折扣,文档AI服务定价为每千页5美元。