小米汽车发布Xiaomi Auto World Model:重建+生成一体化世界模型框架

2026-05-26 16:42:29   |   微观猎人   |   2615

5月26日,小米技术官方宣布,小米汽车正式发布Xiaomi Auto World Model全新框架,为业界辅助驾驶世界模型提供了新的技术路径,推动行业从“场景感知”向“认知推演、场景进化”的高阶形态跃迁。据介绍,这是小米首次将三维重建与视频生成深度耦合的一体化架构,以“重建锚定几何、生成填补想象”的新范式,打破了行业长期采用的重建、生成独立拆分的路线。

目前世界模型有两条主要技术路线:重建(WorldRec)与生成(WorldGen)。重建从多视角观测恢复几何精确的3D场景,优势是高保真、强一致性,但只能还原已见内容;生成通过扩散模型直接预测未来画面,能“想象”未观测视角和未发生场景,但缺乏显式3D结构且长时序下容易漂移失真。Xiaomi Auto World Model将重建模块与生成模块深度耦合,让两者在结构上互相约束,形成闭环互相增益,实现了高稳定性(WorldRec的确定性几何约束有效抑制误差累积)、高一致性(4D场景表征确保全局一致)、高真实性(合成内容既符合物理布局又贴近真实观测)的协同增益。

该框架在Waymo、nuScenes等主流基准测试中全面取得SOTA,并已在小米汽车三大核心场景完成业务落地:合成数据生成方面,已交付超过10万clips高质量合成数据,直接用于感知模型训练;仿真测试方面,构建闭环仿真环境,可在仿真中复现真实事故进行定向优化;辅助驾驶学堂方面,利用世界模型动态生成第一人称驾驶教学视频,目前已上线小米全车型的辅助驾驶学堂实景模拟场景。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

小米汽车发布Xiaomi Auto World Model:重建+生成一体化世界模型框架

2026-05-26 16:42:29 浏览量: 2615 作者: 微观猎人

5月26日,小米技术官方宣布,小米汽车正式发布Xiaomi Auto World Model全新框架,为业界辅助驾驶世界模型提供了新的技术路径,推动行业从“场景感知”向“认知推演、场景进化”的高阶形态跃迁。据介绍,这是小米首次将三维重建与视频生成深度耦合的一体化架构,以“重建锚定几何、生成填补想象”的新范式,打破了行业长期采用的重建、生成独立拆分的路线。

目前世界模型有两条主要技术路线:重建(WorldRec)与生成(WorldGen)。重建从多视角观测恢复几何精确的3D场景,优势是高保真、强一致性,但只能还原已见内容;生成通过扩散模型直接预测未来画面,能“想象”未观测视角和未发生场景,但缺乏显式3D结构且长时序下容易漂移失真。Xiaomi Auto World Model将重建模块与生成模块深度耦合,让两者在结构上互相约束,形成闭环互相增益,实现了高稳定性(WorldRec的确定性几何约束有效抑制误差累积)、高一致性(4D场景表征确保全局一致)、高真实性(合成内容既符合物理布局又贴近真实观测)的协同增益。

该框架在Waymo、nuScenes等主流基准测试中全面取得SOTA,并已在小米汽车三大核心场景完成业务落地:合成数据生成方面,已交付超过10万clips高质量合成数据,直接用于感知模型训练;仿真测试方面,构建闭环仿真环境,可在仿真中复现真实事故进行定向优化;辅助驾驶学堂方面,利用世界模型动态生成第一人称驾驶教学视频,目前已上线小米全车型的辅助驾驶学堂实景模拟场景。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号