OpenAI推出Flex API模式 以速度换成本
4月18日,OpenAI宣布推出创新的”Flex处理模式"API服务,这项新服务允许开发者在模型评估、数据扩充等非实时性任务中,通过接受更慢的响应速度和可能的资源不可用情况,换取最高达50%的费用优惠。
目前,Flex模式已面向最新发布的o3和o4-mini推理模型开放测试。价格方面确实颇具吸引力:o3模型的输入token价格从标准模式的10美元/百万降至5美元,输出token从40美元/百万降至20美元;更轻量级的o4-mini模型优惠幅度同样显著,输入token价格降至0.55美元/百万,输出token降至2.20美元/百万。这种阶梯式的定价策略明显针对不同规模的企业需求,特别是对成本敏感的中小企业和研究机构。
值得注意的是,OpenAI此次同步加强了安全管控措施。公司要求消费层级1-3级的开发者必须完成身份验证流程才能获取o3模型访问权限,同时推理摘要功能和流式API服务也需要通过验证才能启用。这些措施既是对抗API滥用的必要手段,也反映了AI行业对技术伦理和安全性的日益重视。