小鹏发布X-Mind技术框架:让自动驾驶拥有“预见未来”的大脑
6月30日,小鹏汽车近日正式发布X-Mind技术框架,通过内嵌预测性世界模型赋予车载智能体高效的视觉思维链能力,宣称让自动驾驶拥有“预见未来”的大脑。
据介绍,X-Mind的整体架构将预测世界模型无缝嵌入大型驾驶模型中,让模型在输出动作之前先进行显式的时空推演。通过将视觉思维链实例化,车辆可以像经验丰富的老司机一样提前“想在前头”,让每一条规划路径都考虑到未来交通流的变化,具备更好的防御性驾驶能力。
在技术实现上,X-Mind构建了一种融合鸟瞰图布局与抽象驾驶先验的“认知画布”——思维草图,包含车道线、障碍物、动态交通灯状态、自适应导航意图及合规车速轮廓等核心语义信息。通过深度压缩自编码器,系统将12帧未来世界推演压缩至仅96个Token,有效过滤了与规划无关的纹理干扰,从根本上解决了长上下文带来的计算瓶颈。
在训练效果方面,X-Mind在包含数亿帧真实世界数据的训练集上完成了验证。面对前车急刹、匝道汇入及复杂十字路口博弈等场景,系统能够提前推演出障碍物占位和场景因果链条。对比实验数据显示,相比传统VLA模型,X-Mind在横向和纵向轨迹预测误差上均有显著降低,尤其在复杂长尾场景下安全性与合规性大幅提升;同时推理延迟极低,具备在车规级芯片上量产落地的可行性。
据官方消息,X-Mind与X-World、X-Foresight共同构成小鹏物理AI基座模型的技术体系,激活了主动思考、可控生成和长时序推演三大核心能力。随着第二代VLA能力的持续提升,这一能力体系正加速向更广泛的具身智能场景延伸。小鹏汽车CEO何小鹏此前透露,联合国WP29缔约国会议已批准城区NGP及L3-L5自动驾驶相关法规,预计2026年底自动驾驶可在全球合法落地。