Mistral AI推出OCR 4文档识别模型：支持170种语言，输出质量超越GPT与Gemini

2026-06-26 16:47:32 | 唐微 | 5365

6月26日，法国人工智能初创企业Mistral AI于当地时间6月23日宣布推出其最新文档内容识别模型OCR 4。该模型定位于高效的企业级文档处理工具，在输出文本的同时还可提供边框定位、区域分类和置信度评分，为RAG语义分块、智能体结构化处理及企业搜索等下游任务提供精准的数据支撑。

据官方披露，OCR 4模型支持横跨10个语族的170种语言，在OmniDocBench基准测试中取得93.07分。在人类评审偏好测试中，该模型的输出相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受青睐，胜率分别达到66.4%和70%。在独立基准测试OlmOCRBench中，OCR 4也以85.20的综合评分位居领先地位。

作为一款轻量化的专精模型，OCR 4支持PDF、DOC、PPT及OpenDocument等常见企业文档格式，可部署于单个容器内运行，支持企业完全自托管以满足数据主权与合规性要求。Mistral AI表示，OCR 4已集成至Mistral Search Toolkit预览版，可通过Mistral Studio、Amazon SageMaker及Microsoft Foundry等渠道接入。API调用定价为每千页4美元，批处理方式可享50%折扣，文档AI服务定价为每千页5美元。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。