英伟达Blackwell架构GB300芯片实测 4块可完成16块H100任务
8月27日,据科技媒体WccfTech报道,云服务提供商CoreWeave近日完成了一项基于DeepSeek R1推理模型的性能测试,结果显示英伟达新一代Blackwell架构GB300芯片展现出显著的性能突破。测试表明,仅需4块GB300芯片即可完成原本需要16块H100 GPU处理的推理任务,单卡吞吐量提升高达6倍,标志着AI计算效率实现代际跨越。
CoreWeave此次测试重点对比了Blackwell架构GB300 NVL72平台与上一代H100 GPU的性能差异。得益于英伟达全面升级的芯片架构、大幅增强的内存系统及带宽能力,GB300在运行DeepSeek R1等复杂推理模型时表现出色。该平台支持最高37TB(可扩展至40TB)的内存容量和每秒130TB的内存带宽,通过4路并行设计有效减少GPU间数据分割需求,并借助NVLink与NVSwitch高速互连技术显著提升通信效率。
CoreWeave强调,此次性能提升不仅体现在理论算力(FLOPs)层面,更表现为整个系统架构在实际业务环境中的综合优化。对于需部署大规模AI模型的企业用户而言,GB300 NVL72平台提供了更优的扩展性、更低的延迟表现和更高的能效比,有望帮助客户以更低的成本、更快的速度落地AI服务。