英伟达发布GB10超级芯片 3nm工艺集成20核ARM CPU与千TOPS AI算力

2025-08-27 16:31:59   |   嫣然   |   213

8月27日,在近日举办的Hot Chips 2025大会上,英伟达正式揭晓了其新一代GB10超级芯片的架构细节。该芯片基于台积电3nm制程工艺,采用2.5D先进封装技术,将20核ARM v9.2架构CPU与Blackwell架构GPU集成于一体,AI算力最高可达1000 TOPS,而整体TDP控制在140W,旨在将数据中心级的高性能AI计算能力引入桌面级工作站与迷你AI超级计算机平台。

GB10超级芯片首次应用于DGX Spark系列迷你AI超算及工作站产品中,标志着高性能AI算力正逐步向终端设备下沉。其封装结构包含两个核心单元:S-Dielet集成CPU与内存控制子系统,G-Dielet则专注于GPU计算单元,两者通过高带宽互联实现协同工作。

CPU部分采用双集群设计,每集群包含10个基于ARM v9.2架构的核心,各自配备16MB三级缓存,总缓存容量达32MB,提供强劲的多线程处理能力。GPU部分则集成Blackwell架构的图形与计算单元,搭载第五代Tensor Core及光追核心,支持DLSS 4技术。其FP32浮点性能达31 TFLOPs,NVFP4精度下的AI算力高达1000 TOPS,并配有24MB二级缓存,显著提升密集型AI负载处理效率。

内存系统支持256位LPDDR5x-9400内存,容量最高可达128GB,原始带宽为301GB/s。通过C2X接口还可进一步提升总带宽至600GB/s。芯片还提供16MB系统级缓存(L4),优化多引擎间的数据共享与通信效率。

在扩展与显示方面,GB10提供完整的PCIe、USB及以太网接口,支持多路显示输出,最高可驱动8K@120Hz画面。通过网络接口ConnectX-7,用户还可将多台DGX Spark设备互联,扩展至更大规模的AI训练集群,最高可支持4050亿参数的大模型训练任务。安全机制方面,芯片配备双安全根架构及SROOT/OSROOT处理器,支持fTPM和独立TPM,为AI工作负载提供硬件级安全保障。

英伟达透露,GB10是其与联发科合作的成果,CPU IP来自联发科,并在内存访问和能效方面进行了深度优化。该公司还表示,未来该架构有望进一步衍生出面向笔记本电脑与迷你PC等消费级设备的产品,为更广泛的用户带来高效的本地AI计算体验。


特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

英伟达发布GB10超级芯片 3nm工艺集成20核ARM CPU与千TOPS AI算力

2025-08-27 16:31:59 浏览量: 213 作者: 嫣然

8月27日,在近日举办的Hot Chips 2025大会上,英伟达正式揭晓了其新一代GB10超级芯片的架构细节。该芯片基于台积电3nm制程工艺,采用2.5D先进封装技术,将20核ARM v9.2架构CPU与Blackwell架构GPU集成于一体,AI算力最高可达1000 TOPS,而整体TDP控制在140W,旨在将数据中心级的高性能AI计算能力引入桌面级工作站与迷你AI超级计算机平台。

GB10超级芯片首次应用于DGX Spark系列迷你AI超算及工作站产品中,标志着高性能AI算力正逐步向终端设备下沉。其封装结构包含两个核心单元:S-Dielet集成CPU与内存控制子系统,G-Dielet则专注于GPU计算单元,两者通过高带宽互联实现协同工作。

CPU部分采用双集群设计,每集群包含10个基于ARM v9.2架构的核心,各自配备16MB三级缓存,总缓存容量达32MB,提供强劲的多线程处理能力。GPU部分则集成Blackwell架构的图形与计算单元,搭载第五代Tensor Core及光追核心,支持DLSS 4技术。其FP32浮点性能达31 TFLOPs,NVFP4精度下的AI算力高达1000 TOPS,并配有24MB二级缓存,显著提升密集型AI负载处理效率。

内存系统支持256位LPDDR5x-9400内存,容量最高可达128GB,原始带宽为301GB/s。通过C2X接口还可进一步提升总带宽至600GB/s。芯片还提供16MB系统级缓存(L4),优化多引擎间的数据共享与通信效率。

在扩展与显示方面,GB10提供完整的PCIe、USB及以太网接口,支持多路显示输出,最高可驱动8K@120Hz画面。通过网络接口ConnectX-7,用户还可将多台DGX Spark设备互联,扩展至更大规模的AI训练集群,最高可支持4050亿参数的大模型训练任务。安全机制方面,芯片配备双安全根架构及SROOT/OSROOT处理器,支持fTPM和独立TPM,为AI工作负载提供硬件级安全保障。

英伟达透露,GB10是其与联发科合作的成果,CPU IP来自联发科,并在内存访问和能效方面进行了深度优化。该公司还表示,未来该架构有望进一步衍生出面向笔记本电脑与迷你PC等消费级设备的产品,为更广泛的用户带来高效的本地AI计算体验。


,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号