阿里凌晨三点发布新的视觉推理模型QVQ-Max

2025-03-28 17:38:57 | 弘乐 | 1540

3月28日，阿里在X上发布视觉推理模型QVQ-Max。作为QVQ-72B-Preview的升级版，官方表示，新模型针对传统AI在视觉信息处理上的不足进行了优化，增强了从视觉感知到认知推理的能力。

QVQ-Max支持图像、视频与文本的联合推理。在MathVision benchmark测试中，QVQ-Max表现出“thinking长度”与准确率正相关的特性，验证了模型在复杂多模态任务中的潜力。

官方表示，QVQ-Max在三方面表现突出：一是细致观察，能够精准识别图像中的细节和文字标识；二是深入推理，结合背景知识进行分析和推理；三是灵活应用，支持创意生成和内容创作。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。