商汤开源 SenseNova-SI 模型:能理解空间结构
11月11日,商汤科技发布并开源 SenseNova-SI 系列模型。官方宣布,在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。同时,其在空间智能领域实现重要突破。
商汤科技表示,当前行业领先的大模型虽在知识、写作、推理、编程等方面展示了突出的性能,但普遍对空间结构的理解和推理存在很严重的短板,而这恰恰是具身智能体与世界交互所需要的关键基础能力。
这次开源的 SenseNova-SI 空间智能大模型系列包括 2B 和 8B 两个规格。官方提供的评测数据显示,SenseNova-SI 系列模型在空间智能多个基准测试(VSI、MMSI、MindCube、ViewSpatial)中表现突出。
其中 SenseNova-SI-8B 模型在四个基本评测中获得 60.99 的平均成绩,不仅大幅领先 Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源通用多模态模型,以及 SpatialMLLM(35.05)、ViLaSR-7B(36.41)等专门的空间智能模型,还以相对轻量的模型规格实现了对 GPT-5(49.68)、Gemini-2.5-Pro(48.81)等顶级闭源模型的超越。这里显著的性能提升反映了模型在空间智能上获得了质的突破,而不是简单的性能改善。