小米宣布MiMo-V2.5-Pro-UltraSpeed限时体验延期,超6.6万开发者申请远超预期
6月24日,小米官方发布《关于MiMo-V2.5-Pro-UltraSpeed限时体验延期的通知》,宣布延长UltraSpeed限时体验窗口,以便更多开发者有机会接入体验1000 tokens/s的高速推理能力。此前该体验原计划于6月9日至6月23日开放,因市场需求远超预期,小米决定延期以响应社区呼声。
据官方披露,截至6月23日,小米已收到超过6.6万个使用申请,申请方涵盖世界500强公司、行业头部企业及个人开发者,覆盖法律、金融、通信、物流、汽车制造、文化传媒、高校等多个领域,远超预期。小米表示,社区对UltraSpeed“迫切而真实的需求”促使团队作出延期决定。
本次延期后,用户仍可继续申请内测,已审核通过的用户可继续使用相关服务,具体下线时间将根据资源情况另行安排,届时会提前告知。据报道,MiMo-V2.5-Pro-UltraSpeed是全球首个在通用GPU上突破1000 tokens/s的万亿参数模型,刷新了旗舰模型全球最快推理速度纪录。该版本同步上线限时API服务,定价为原版MiMo-V2.5-Pro的3倍,但生成速度提升约10倍,在高并发、低延迟等应用场景下具备较高性价比。
通过审核的用户此前可获得限时免费的Chat体验,试用服务规则为:每个账号每日最多成功进入队列10次,单次会话时长上限30分钟,如会话空闲超过5分钟系统将自动释放资源。业内人士指出,超6.6万个申请的火爆需求倒逼小米延长体验窗口,反映出市场对极致推理速度的真实需求。当“3倍价格换10倍速度”被验证为有效范式,大模型推理的速度竞赛才刚刚开始。