雷军谈小米自动驾驶模型Xiaomi OneVL:率先将VLA与世界模型统一于潜空间推理框架
5月14日,小米技术昨日正式发布并开源Xiaomi OneVL一步式潜空间语言视觉推理框架。小米创办人、董事长兼CEO雷军昨晚发文谈及该自动驾驶模型时表示,Xiaomi OneVL在业内率先通过潜空间推理,将VLA(视觉语言动作模型)与世界模型统一到同一套框架中。
雷军还提到,在推理、规划等多个主流基准上,Xiaomi OneVL全面刷新了潜在推理方法的性能上限,模型与代码已全面开源。他向全球开发者与研究人员发出邀请,共同探索自动驾驶大模型的更多可能性。
据小米技术官方介绍,Xiaomi OneVL在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一。在具备XLA模型强悍推理能力的基础上,大幅提升了推理速度和精度,是行业内具有开创性的方案——在精度上超越显式CoT(思维链),在速度上对齐“仅答案”预测的潜空间CoT方案。小米已将Xiaomi OneVL的模型权重以及训练、推理代码全面开源。