小米发布开源MoE模型MiMo-V2-Flash,推出在线AI聊天服务
12月16日晚,小米正式推出专为智能体设计的高效开源MoE模型Xiaomi MiMo-V2-Flash,并同步上线在线AI聊天服务Xiaomi MiMO Studio。该模型以“极速推理”为核心特点,总参数量达3090亿,激活参数为150亿,在多项智能体评测中表现领先,代码能力已接近顶尖闭源模型水平。
小米表示,MiMo-V2-Flash采用混合注意力架构,结合全局注意力与滑动窗口注意力机制,支持32K原生上下文并扩展至256K训练窗口。在多项基准测试中,其表现进入全球开源模型前二,代码生成能力超越所有开源模型,与Claude 4.5 Sonnet相当,而推理成本仅为后者的2.5%,生成速度提升两倍。
为方便用户体验,小米同步推出了基于该模型的在线聊天服务Xiaomi MiMO Studio。用户可通过网页直接与模型对话,该服务支持深度思考与联网搜索功能,初步展现了小米在AI交互层面的技术布局。
在开源策略上,小米将MiMo-V2-Flash的模型权重与推理代码以MIT协议全面开放。同时,该模型的API服务采取限时免费策略,定价为输入每百万token 0.1美元、输出每百万token 0.3美元,降低了开发者的使用门槛。
此次发布,标志着小米在大型模型赛道进一步向高性能、低成本、开源化方向推进。通过推出兼具代码能力与推理效率的MoE模型,并结合在线服务落地,小米正试图在AI基础架构与用户体验两端同步建立影响力。随着模型的开源与API开放,其技术成果或将更广泛地赋能开发者生态与行业应用。