JetBrains开源Mellum2模型:12B参数,从代码补全升级为AI智能体编程助手
6月2日,JetBrains昨日发布博文,宣布开源Mellum2模型,这是面向软件工程系统的新机器学习模型。相比原版Mellum,它从代码补全模型升级为完整编码助手,并将上下文窗口从8192 Token扩至131072 Token。开发者可在Apache 2.0许可证下部署基础版、指令版和思考版。参数上,Mellum2总规模12B,高于Mellum的4B。该模型采用稀疏混合专家框架,激活参数量2.5B,在标准硬件上仍能保持较快计算。
能力方面,Mellum2可生成和编辑代码、调用外部工具、执行多步骤智能体式工作流、维持长对话。JetBrains将其定位在AI工作负载路由与编排、低延迟RAG管线、复杂工作流中的快速子智能体,以及私有本地AI部署。训练方面,团队称预训练阶段采用三阶段数据课程,数据混合逐步从多样化网页内容转向精选代码和数学内容,使模型更贴近软件工程任务。