阿里凌晨三点发布新的视觉推理模型QVQ-Max

2025-03-28 17:38:57   |   弘乐   |   1526

3月28日,阿里在X上发布视觉推理模型QVQ-Max。作为QVQ-72B-Preview的升级版,官方表示,新模型针对传统AI在视觉信息处理上的不足进行了优化,增强了从视觉感知到认知推理的能力。

QVQ-Max支持图像、视频与文本的联合推理。在MathVision benchmark测试中,QVQ-Max表现出“thinking长度”与准确率正相关的特性,验证了模型在复杂多模态任务中的潜力。

官方表示,QVQ-Max在三方面表现突出:一是细致观察,能够精准识别图像中的细节和文字标识;二是深入推理,结合背景知识进行分析和推理;三是灵活应用,支持创意生成和内容创作。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

阿里凌晨三点发布新的视觉推理模型QVQ-Max

2025-03-28 17:38:57 浏览量: 1526 作者: 弘乐

3月28日,阿里在X上发布视觉推理模型QVQ-Max。作为QVQ-72B-Preview的升级版,官方表示,新模型针对传统AI在视觉信息处理上的不足进行了优化,增强了从视觉感知到认知推理的能力。

QVQ-Max支持图像、视频与文本的联合推理。在MathVision benchmark测试中,QVQ-Max表现出“thinking长度”与准确率正相关的特性,验证了模型在复杂多模态任务中的潜力。

官方表示,QVQ-Max在三方面表现突出:一是细致观察,能够精准识别图像中的细节和文字标识;二是深入推理,结合背景知识进行分析和推理;三是灵活应用,支持创意生成和内容创作。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号