DeepSeek V4正式版官宣7月中旬上线,同步引入峰谷定价机制

2026-06-30 16:37:16   |   文白不白   |   10287

6月30日,DeepSeek团队今日正式宣布,DeepSeek V4正式版计划于7月中旬上线。本次版本更新将带来更多功能优化和性能提升,同时为了更合理地配置算力资源、提升服务稳定性,正式版发布后将同步调整API定价策略,首次引入峰谷定价机制。

根据官方公布的价格方案,API在高峰时段的价格将是平时的2倍,平时价格与DeepSeek V4 API现行定价保持一致。高峰时段定义为每日上午9点至12点、下午2点至6点,其余时段均按平时价格计费。以V4-Flash为例,高峰时段输入价格为每百万token 2元(缓存命中可低至0.02元),输出价格为每百万token 4元;旗舰版V4-Pro因算力成本较高,高峰时段输入价格为每百万token 6元(缓存命中1元),输出为12元。

据官方此前披露,DeepSeek V4预览版已于今年4月24日上线并同步开源,主打百万字超长上下文能力,在智能体协同、世界知识与推理性能等维度均处于国内及开源模型前列。V4系列采用MoE混合专家架构,分两个版本:旗舰版V4-Pro总参数达1.6万亿,激活参数490亿,定位高性能复杂任务场景;轻量版V4-Flash总参数2840亿,激活参数130亿,推理开销与显存占用大幅降低。两个版本均原生支持100万token超长上下文,并采用MIT开源协议,允许开发者免费商用与二次开发。

技术层面,V4系列的核心亮点在于全新的注意力机制——在token维度进行高效压缩,结合DSA稀疏注意力方案,大幅削减计算与显存开销。实测显示,在百万token场景下推理计算量仅为前代V3.2的约27%,显存占用低至10%,显著提升了长上下文处理效率。官方此前表示,待下半年新一代昇腾950芯片大规模交付后,V4-Pro版本的综合使用成本还将进一步下降。

定价策略的调整在开发者社群引发热议,有开发者认为高峰时段覆盖了国内主要工作时间,对国内用户并不友好;但也有观点指出,DeepSeek定价本身处于行业较低水平,即便高峰翻倍仍具竞争力。随着峰谷定价机制落地,算力按需分层计费或将成为国产大模型的行业常态,开发者也需要开始重新审视任务编排与缓存策略来优化使用成本。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

DeepSeek V4正式版官宣7月中旬上线,同步引入峰谷定价机制

2026-06-30 16:37:16 浏览量: 10287 作者: 文白不白

6月30日,DeepSeek团队今日正式宣布,DeepSeek V4正式版计划于7月中旬上线。本次版本更新将带来更多功能优化和性能提升,同时为了更合理地配置算力资源、提升服务稳定性,正式版发布后将同步调整API定价策略,首次引入峰谷定价机制。

根据官方公布的价格方案,API在高峰时段的价格将是平时的2倍,平时价格与DeepSeek V4 API现行定价保持一致。高峰时段定义为每日上午9点至12点、下午2点至6点,其余时段均按平时价格计费。以V4-Flash为例,高峰时段输入价格为每百万token 2元(缓存命中可低至0.02元),输出价格为每百万token 4元;旗舰版V4-Pro因算力成本较高,高峰时段输入价格为每百万token 6元(缓存命中1元),输出为12元。

据官方此前披露,DeepSeek V4预览版已于今年4月24日上线并同步开源,主打百万字超长上下文能力,在智能体协同、世界知识与推理性能等维度均处于国内及开源模型前列。V4系列采用MoE混合专家架构,分两个版本:旗舰版V4-Pro总参数达1.6万亿,激活参数490亿,定位高性能复杂任务场景;轻量版V4-Flash总参数2840亿,激活参数130亿,推理开销与显存占用大幅降低。两个版本均原生支持100万token超长上下文,并采用MIT开源协议,允许开发者免费商用与二次开发。

技术层面,V4系列的核心亮点在于全新的注意力机制——在token维度进行高效压缩,结合DSA稀疏注意力方案,大幅削减计算与显存开销。实测显示,在百万token场景下推理计算量仅为前代V3.2的约27%,显存占用低至10%,显著提升了长上下文处理效率。官方此前表示,待下半年新一代昇腾950芯片大规模交付后,V4-Pro版本的综合使用成本还将进一步下降。

定价策略的调整在开发者社群引发热议,有开发者认为高峰时段覆盖了国内主要工作时间,对国内用户并不友好;但也有观点指出,DeepSeek定价本身处于行业较低水平,即便高峰翻倍仍具竞争力。随着峰谷定价机制落地,算力按需分层计费或将成为国产大模型的行业常态,开发者也需要开始重新审视任务编排与缓存策略来优化使用成本。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号