智元机器人开源全球首个ViLLA架构通用具身智能模型GO-1

2025-09-23 18:17:30   |   探索者   |   1563

9月23日,智元机器人宣布正式在GitHub开源其通用具身基座大模型GO-1(Genie Operator-1),这是继今年1月开放AgiBot World百万真机数据集后,该公司在推动具身智能技术普及方面的又一重要举措。官方表示,GO-1是全球首个采用Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型,其开源将大幅降低行业技术门槛,加速智能机器人研发与应用落地。

GO-1模型通过引入隐式动作标记,有效弥合了图像-文本输入与机器人动作执行之间的语义差距。其三层架构整合了多模态理解、隐式规划与动作生成能力:基于InternVL-2B的视觉语言模型处理多视角图像、力觉及语言信息;隐式规划器预测高层次任务规划;扩散模型驱动的动作专家则生成高精度连续动作序列。

为支持开发者高效使用,智元机器人同步推出Genie Studio一站式开发平台,提供从数据采集、模型训练到真机部署的全流程工具链。尽管GO-1基于AgiBot G1机器人数据预训练,但已在松灵机器人、Franka机械臂等多类本体上验证具备良好可移植性。在Genie Sim与Libero等仿真平台测试中,模型性能均达到领先水平。

此次开源不仅包含模型代码与文档,还集成通用LeRobot数据格式,支持不同机器人本体的适配与二次开发。智元机器人希望通过社区共建推动具身智能生态发展,为AI研究者与开发者提供高效、开放的技术基础。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

智元机器人开源全球首个ViLLA架构通用具身智能模型GO-1

2025-09-23 18:17:30 浏览量: 1563 作者: 探索者

9月23日,智元机器人宣布正式在GitHub开源其通用具身基座大模型GO-1(Genie Operator-1),这是继今年1月开放AgiBot World百万真机数据集后,该公司在推动具身智能技术普及方面的又一重要举措。官方表示,GO-1是全球首个采用Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型,其开源将大幅降低行业技术门槛,加速智能机器人研发与应用落地。

GO-1模型通过引入隐式动作标记,有效弥合了图像-文本输入与机器人动作执行之间的语义差距。其三层架构整合了多模态理解、隐式规划与动作生成能力:基于InternVL-2B的视觉语言模型处理多视角图像、力觉及语言信息;隐式规划器预测高层次任务规划;扩散模型驱动的动作专家则生成高精度连续动作序列。

为支持开发者高效使用,智元机器人同步推出Genie Studio一站式开发平台,提供从数据采集、模型训练到真机部署的全流程工具链。尽管GO-1基于AgiBot G1机器人数据预训练,但已在松灵机器人、Franka机械臂等多类本体上验证具备良好可移植性。在Genie Sim与Libero等仿真平台测试中,模型性能均达到领先水平。

此次开源不仅包含模型代码与文档,还集成通用LeRobot数据格式,支持不同机器人本体的适配与二次开发。智元机器人希望通过社区共建推动具身智能生态发展,为AI研究者与开发者提供高效、开放的技术基础。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号