小米发布开源MoE模型MiMo-V2-Flash，推出在线AI聊天服务

2025-12-17 18:48:20 | 棠糖 | 1857

12月16日晚，小米正式推出专为智能体设计的高效开源MoE模型Xiaomi MiMo-V2-Flash，并同步上线在线AI聊天服务Xiaomi MiMO Studio。该模型以“极速推理”为核心特点，总参数量达3090亿，激活参数为150亿，在多项智能体评测中表现领先，代码能力已接近顶尖闭源模型水平。

小米表示，MiMo-V2-Flash采用混合注意力架构，结合全局注意力与滑动窗口注意力机制，支持32K原生上下文并扩展至256K训练窗口。在多项基准测试中，其表现进入全球开源模型前二，代码生成能力超越所有开源模型，与Claude 4.5 Sonnet相当，而推理成本仅为后者的2.5%，生成速度提升两倍。

为方便用户体验，小米同步推出了基于该模型的在线聊天服务Xiaomi MiMO Studio。用户可通过网页直接与模型对话，该服务支持深度思考与联网搜索功能，初步展现了小米在AI交互层面的技术布局。

在开源策略上，小米将MiMo-V2-Flash的模型权重与推理代码以MIT协议全面开放。同时，该模型的API服务采取限时免费策略，定价为输入每百万token 0.1美元、输出每百万token 0.3美元，降低了开发者的使用门槛。

此次发布，标志着小米在大型模型赛道进一步向高性能、低成本、开源化方向推进。通过推出兼具代码能力与推理效率的MoE模型，并结合在线服务落地，小米正试图在AI基础架构与用户体验两端同步建立影响力。随着模型的开源与API开放，其技术成果或将更广泛地赋能开发者生态与行业应用。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。