英伟达Blackwell架构GB300芯片实测 4块可完成16块H100任务

2025-08-27 16:48:28   |   微观猎人   |   203

8月27日,据科技媒体WccfTech报道,云服务提供商CoreWeave近日完成了一项基于DeepSeek R1推理模型的性能测试,结果显示英伟达新一代Blackwell架构GB300芯片展现出显著的性能突破。测试表明,仅需4块GB300芯片即可完成原本需要16块H100 GPU处理的推理任务,单卡吞吐量提升高达6倍,标志着AI计算效率实现代际跨越。

CoreWeave此次测试重点对比了Blackwell架构GB300 NVL72平台与上一代H100 GPU的性能差异。得益于英伟达全面升级的芯片架构、大幅增强的内存系统及带宽能力,GB300在运行DeepSeek R1等复杂推理模型时表现出色。该平台支持最高37TB(可扩展至40TB)的内存容量和每秒130TB的内存带宽,通过4路并行设计有效减少GPU间数据分割需求,并借助NVLink与NVSwitch高速互连技术显著提升通信效率。

CoreWeave强调,此次性能提升不仅体现在理论算力(FLOPs)层面,更表现为整个系统架构在实际业务环境中的综合优化。对于需部署大规模AI模型的企业用户而言,GB300 NVL72平台提供了更优的扩展性、更低的延迟表现和更高的能效比,有望帮助客户以更低的成本、更快的速度落地AI服务。


特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

英伟达Blackwell架构GB300芯片实测 4块可完成16块H100任务

2025-08-27 16:48:28 浏览量: 203 作者: 微观猎人

8月27日,据科技媒体WccfTech报道,云服务提供商CoreWeave近日完成了一项基于DeepSeek R1推理模型的性能测试,结果显示英伟达新一代Blackwell架构GB300芯片展现出显著的性能突破。测试表明,仅需4块GB300芯片即可完成原本需要16块H100 GPU处理的推理任务,单卡吞吐量提升高达6倍,标志着AI计算效率实现代际跨越。

CoreWeave此次测试重点对比了Blackwell架构GB300 NVL72平台与上一代H100 GPU的性能差异。得益于英伟达全面升级的芯片架构、大幅增强的内存系统及带宽能力,GB300在运行DeepSeek R1等复杂推理模型时表现出色。该平台支持最高37TB(可扩展至40TB)的内存容量和每秒130TB的内存带宽,通过4路并行设计有效减少GPU间数据分割需求,并借助NVLink与NVSwitch高速互连技术显著提升通信效率。

CoreWeave强调,此次性能提升不仅体现在理论算力(FLOPs)层面,更表现为整个系统架构在实际业务环境中的综合优化。对于需部署大规模AI模型的企业用户而言,GB300 NVL72平台提供了更优的扩展性、更低的延迟表现和更高的能效比,有望帮助客户以更低的成本、更快的速度落地AI服务。


,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号