小米MiMo-V2.5系列模型开启公测:Pro版4.3小时完成完整编译器
4月23日,小米宣布Xiaomi MiMo-V2.5系列模型正式开启公测。MiMo-V2.5-Pro和MiMo-V2.5模型即将全球开源。该系列包含MiMo-V2.5、V2.5-Pro、V2.5-TTS Series、V2.5-ASR,拥有更强的推理、更稳的Agent、更长的上下文、更强的指令遵循与模糊指令理解、更好的全模态感知和理解能力。
MiMo-V2.5-Pro是小米迄今最强大的模型。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型正面较量。内部测试中,MiMo-V2.5-Pro可以稳定完成单次涉及近千轮工具调用的长程任务。
在具体任务中,MiMo-V2.5-Pro用时仅4.3小时、经过672次工具调用,从零用Rust实现了一个完整的SysY编译器(词法分析器、语法分析器、AST、Koopa IR代码生成、RISC-V汇编后端及性能优化),在隐藏测试集上取得233/233的满分。作为参考,北京大学本科生完成该项目通常需要数周时间。
在另一个任务中,仅凭“构建一个视频编辑器Web应用”的简单指令,MiMo-V2.5-Pro便交付了一款可运行的Web应用,具备多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等功能。最终代码量达8,192行,历经1,868次工具调用,在11.5小时的自主工作中完成。
MiMo-V2.5是为Agent场景而生的原生全模态大模型,能同时看、听、读,并把理解转化为行动。在Claw-Eval等权威Agent评测中,MiMo-V2.5超过MiMo-V2-Pro水平,同时API成本降低约50%。多模态感知方面,跨模态推理、视频理解、图表分析等能力提升,在VideoMME、CharXiv、MMMU-Pro等评测中逼近甚至超越业界顶级闭源模型。
MiMo-V2.5全系列针对Token效率进行优化。在达到相同Agent基准分数情况下,MiMo-V2.5-Pro相比Kimi K2.6节省了42% Token,MiMo-V2.5相比Muse Spark节省了50% Token。小米同步优化了Token Plan定价方案:MiMo-V2.5消耗速率为1x(1 Token = 1 Credit),MiMo-V2.5-Pro为2x;取消1 Token = 4 Credits计费方式,不再区分256k和1M上下文窗口的Credit倍率。新增夜间优惠(北京时间00:00-08:00所有模型8折)、连续包月(老用户次月7折,新用户次月77折)和包年订阅(全年88折)等选项。