阶跃星辰发布开源模型Step 3.5 Flash:主打高推理速度与Agent智能
2月2日,人工智能公司阶跃星辰正式发布其最新开源基座模型Step 3.5 Flash。该模型主打强大的推理能力与面向智能体(Agent)场景的优化,官方宣称其在Agent任务与数学推理中表现可媲美闭源模型,并具备高速推理与长链条任务稳定性。
在性能表现上,Step 3.5 Flash在单请求代码类任务中推理速度最高可达350 TPS。官方评测显示,该模型在Agent相关场景及数学任务上已接近闭源模型水平,并且在复杂、长链条任务中展现出良好的稳定性。通过其特有的“并行思考”增强机制,模型在深度推理类任务上的表现还可进一步提升。
为兼顾能力、速度与成本,Step 3.5 Flash在架构设计上融合了多项技术优化。模型采用稀疏混合专家架构,总参数量达1960亿,但每个token实际仅激活约110亿参数,在保持能力的同时控制计算开销。其引入的MTP-3机制支持一次预测三个token,显著提升生成效率。此外,模型采用滑动窗口与全局注意力混合的注意力设计,使其能够高效处理长达256K的上下文,在长文本中聚焦关键信息,减少冗余计算。
随着智能体应用逐渐从原型走向落地,行业对模型的响应速度、可靠性及推理成本提出了更高要求。阶跃星辰此次推出的Step 3.5 Flash,正是针对这些需求进行优化的尝试。官方表示,该模型已全量上线,并同步宣布已启动下一代Step 4模型的训练,邀请开发社区共同参与后续模型的演进与共创。