Mistral AI推出OCR 4文档识别模型:支持170种语言,输出质量超越GPT与Gemini

2026-06-26 16:47:32   |   唐微   |   5365

6月26日,法国人工智能初创企业Mistral AI于当地时间6月23日宣布推出其最新文档内容识别模型OCR 4。该模型定位于高效的企业级文档处理工具,在输出文本的同时还可提供边框定位、区域分类和置信度评分,为RAG语义分块、智能体结构化处理及企业搜索等下游任务提供精准的数据支撑。

据官方披露,OCR 4模型支持横跨10个语族的170种语言,在OmniDocBench基准测试中取得93.07分。在人类评审偏好测试中,该模型的输出相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受青睐,胜率分别达到66.4%和70%。在独立基准测试OlmOCRBench中,OCR 4也以85.20的综合评分位居领先地位。

作为一款轻量化的专精模型,OCR 4支持PDF、DOC、PPT及OpenDocument等常见企业文档格式,可部署于单个容器内运行,支持企业完全自托管以满足数据主权与合规性要求。Mistral AI表示,OCR 4已集成至Mistral Search Toolkit预览版,可通过Mistral Studio、Amazon SageMaker及Microsoft Foundry等渠道接入。API调用定价为每千页4美元,批处理方式可享50%折扣,文档AI服务定价为每千页5美元。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

Mistral AI推出OCR 4文档识别模型:支持170种语言,输出质量超越GPT与Gemini

2026-06-26 16:47:32 浏览量: 5365 作者: 唐微

6月26日,法国人工智能初创企业Mistral AI于当地时间6月23日宣布推出其最新文档内容识别模型OCR 4。该模型定位于高效的企业级文档处理工具,在输出文本的同时还可提供边框定位、区域分类和置信度评分,为RAG语义分块、智能体结构化处理及企业搜索等下游任务提供精准的数据支撑。

据官方披露,OCR 4模型支持横跨10个语族的170种语言,在OmniDocBench基准测试中取得93.07分。在人类评审偏好测试中,该模型的输出相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受青睐,胜率分别达到66.4%和70%。在独立基准测试OlmOCRBench中,OCR 4也以85.20的综合评分位居领先地位。

作为一款轻量化的专精模型,OCR 4支持PDF、DOC、PPT及OpenDocument等常见企业文档格式,可部署于单个容器内运行,支持企业完全自托管以满足数据主权与合规性要求。Mistral AI表示,OCR 4已集成至Mistral Search Toolkit预览版,可通过Mistral Studio、Amazon SageMaker及Microsoft Foundry等渠道接入。API调用定价为每千页4美元,批处理方式可享50%折扣,文档AI服务定价为每千页5美元。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号