小米MiMo-V2.5系列模型开启公测:Pro版4.3小时完成完整编译器

2026-04-23 18:57:55   |   探索者   |   1628

4月23日,小米宣布Xiaomi MiMo-V2.5系列模型正式开启公测。MiMo-V2.5-Pro和MiMo-V2.5模型即将全球开源。该系列包含MiMo-V2.5、V2.5-Pro、V2.5-TTS Series、V2.5-ASR,拥有更强的推理、更稳的Agent、更长的上下文、更强的指令遵循与模糊指令理解、更好的全模态感知和理解能力。

MiMo-V2.5-Pro是小米迄今最强大的模型。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型正面较量。内部测试中,MiMo-V2.5-Pro可以稳定完成单次涉及近千轮工具调用的长程任务。

在具体任务中,MiMo-V2.5-Pro用时仅4.3小时、经过672次工具调用,从零用Rust实现了一个完整的SysY编译器(词法分析器、语法分析器、AST、Koopa IR代码生成、RISC-V汇编后端及性能优化),在隐藏测试集上取得233/233的满分。作为参考,北京大学本科生完成该项目通常需要数周时间。

在另一个任务中,仅凭“构建一个视频编辑器Web应用”的简单指令,MiMo-V2.5-Pro便交付了一款可运行的Web应用,具备多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等功能。最终代码量达8,192行,历经1,868次工具调用,在11.5小时的自主工作中完成。

MiMo-V2.5是为Agent场景而生的原生全模态大模型,能同时看、听、读,并把理解转化为行动。在Claw-Eval等权威Agent评测中,MiMo-V2.5超过MiMo-V2-Pro水平,同时API成本降低约50%。多模态感知方面,跨模态推理、视频理解、图表分析等能力提升,在VideoMME、CharXiv、MMMU-Pro等评测中逼近甚至超越业界顶级闭源模型。

MiMo-V2.5全系列针对Token效率进行优化。在达到相同Agent基准分数情况下,MiMo-V2.5-Pro相比Kimi K2.6节省了42% Token,MiMo-V2.5相比Muse Spark节省了50% Token。小米同步优化了Token Plan定价方案:MiMo-V2.5消耗速率为1x(1 Token = 1 Credit),MiMo-V2.5-Pro为2x;取消1 Token = 4 Credits计费方式,不再区分256k和1M上下文窗口的Credit倍率。新增夜间优惠(北京时间00:00-08:00所有模型8折)、连续包月(老用户次月7折,新用户次月77折)和包年订阅(全年88折)等选项。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

小米MiMo-V2.5系列模型开启公测:Pro版4.3小时完成完整编译器

2026-04-23 18:57:55 浏览量: 1628 作者: 探索者

4月23日,小米宣布Xiaomi MiMo-V2.5系列模型正式开启公测。MiMo-V2.5-Pro和MiMo-V2.5模型即将全球开源。该系列包含MiMo-V2.5、V2.5-Pro、V2.5-TTS Series、V2.5-ASR,拥有更强的推理、更稳的Agent、更长的上下文、更强的指令遵循与模糊指令理解、更好的全模态感知和理解能力。

MiMo-V2.5-Pro是小米迄今最强大的模型。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型正面较量。内部测试中,MiMo-V2.5-Pro可以稳定完成单次涉及近千轮工具调用的长程任务。

在具体任务中,MiMo-V2.5-Pro用时仅4.3小时、经过672次工具调用,从零用Rust实现了一个完整的SysY编译器(词法分析器、语法分析器、AST、Koopa IR代码生成、RISC-V汇编后端及性能优化),在隐藏测试集上取得233/233的满分。作为参考,北京大学本科生完成该项目通常需要数周时间。

在另一个任务中,仅凭“构建一个视频编辑器Web应用”的简单指令,MiMo-V2.5-Pro便交付了一款可运行的Web应用,具备多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等功能。最终代码量达8,192行,历经1,868次工具调用,在11.5小时的自主工作中完成。

MiMo-V2.5是为Agent场景而生的原生全模态大模型,能同时看、听、读,并把理解转化为行动。在Claw-Eval等权威Agent评测中,MiMo-V2.5超过MiMo-V2-Pro水平,同时API成本降低约50%。多模态感知方面,跨模态推理、视频理解、图表分析等能力提升,在VideoMME、CharXiv、MMMU-Pro等评测中逼近甚至超越业界顶级闭源模型。

MiMo-V2.5全系列针对Token效率进行优化。在达到相同Agent基准分数情况下,MiMo-V2.5-Pro相比Kimi K2.6节省了42% Token,MiMo-V2.5相比Muse Spark节省了50% Token。小米同步优化了Token Plan定价方案:MiMo-V2.5消耗速率为1x(1 Token = 1 Credit),MiMo-V2.5-Pro为2x;取消1 Token = 4 Credits计费方式,不再区分256k和1M上下文窗口的Credit倍率。新增夜间优惠(北京时间00:00-08:00所有模型8折)、连续包月(老用户次月7折,新用户次月77折)和包年订阅(全年88折)等选项。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号