JetBrains开源Mellum2模型:12B参数,从代码补全升级为AI智能体编程助手

2026-06-02 18:30:48   |   嫣然   |   1256

6月2日,JetBrains昨日发布博文,宣布开源Mellum2模型,这是面向软件工程系统的新机器学习模型。相比原版Mellum,它从代码补全模型升级为完整编码助手,并将上下文窗口从8192 Token扩至131072 Token。开发者可在Apache 2.0许可证下部署基础版、指令版和思考版。参数上,Mellum2总规模12B,高于Mellum的4B。该模型采用稀疏混合专家框架,激活参数量2.5B,在标准硬件上仍能保持较快计算。

能力方面,Mellum2可生成和编辑代码、调用外部工具、执行多步骤智能体式工作流、维持长对话。JetBrains将其定位在AI工作负载路由与编排、低延迟RAG管线、复杂工作流中的快速子智能体,以及私有本地AI部署。训练方面,团队称预训练阶段采用三阶段数据课程,数据混合逐步从多样化网页内容转向精选代码和数学内容,使模型更贴近软件工程任务。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

JetBrains开源Mellum2模型:12B参数,从代码补全升级为AI智能体编程助手

2026-06-02 18:30:48 浏览量: 1256 作者: 嫣然

6月2日,JetBrains昨日发布博文,宣布开源Mellum2模型,这是面向软件工程系统的新机器学习模型。相比原版Mellum,它从代码补全模型升级为完整编码助手,并将上下文窗口从8192 Token扩至131072 Token。开发者可在Apache 2.0许可证下部署基础版、指令版和思考版。参数上,Mellum2总规模12B,高于Mellum的4B。该模型采用稀疏混合专家框架,激活参数量2.5B,在标准硬件上仍能保持较快计算。

能力方面,Mellum2可生成和编辑代码、调用外部工具、执行多步骤智能体式工作流、维持长对话。JetBrains将其定位在AI工作负载路由与编排、低延迟RAG管线、复杂工作流中的快速子智能体,以及私有本地AI部署。训练方面,团队称预训练阶段采用三阶段数据课程,数据混合逐步从多样化网页内容转向精选代码和数学内容,使模型更贴近软件工程任务。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号