英伟达发布GB10超级芯片 3nm工艺集成20核ARM CPU与千TOPS AI算力
8月27日,在近日举办的Hot Chips 2025大会上,英伟达正式揭晓了其新一代GB10超级芯片的架构细节。该芯片基于台积电3nm制程工艺,采用2.5D先进封装技术,将20核ARM v9.2架构CPU与Blackwell架构GPU集成于一体,AI算力最高可达1000 TOPS,而整体TDP控制在140W,旨在将数据中心级的高性能AI计算能力引入桌面级工作站与迷你AI超级计算机平台。
GB10超级芯片首次应用于DGX Spark系列迷你AI超算及工作站产品中,标志着高性能AI算力正逐步向终端设备下沉。其封装结构包含两个核心单元:S-Dielet集成CPU与内存控制子系统,G-Dielet则专注于GPU计算单元,两者通过高带宽互联实现协同工作。
CPU部分采用双集群设计,每集群包含10个基于ARM v9.2架构的核心,各自配备16MB三级缓存,总缓存容量达32MB,提供强劲的多线程处理能力。GPU部分则集成Blackwell架构的图形与计算单元,搭载第五代Tensor Core及光追核心,支持DLSS 4技术。其FP32浮点性能达31 TFLOPs,NVFP4精度下的AI算力高达1000 TOPS,并配有24MB二级缓存,显著提升密集型AI负载处理效率。
内存系统支持256位LPDDR5x-9400内存,容量最高可达128GB,原始带宽为301GB/s。通过C2X接口还可进一步提升总带宽至600GB/s。芯片还提供16MB系统级缓存(L4),优化多引擎间的数据共享与通信效率。
在扩展与显示方面,GB10提供完整的PCIe、USB及以太网接口,支持多路显示输出,最高可驱动8K@120Hz画面。通过网络接口ConnectX-7,用户还可将多台DGX Spark设备互联,扩展至更大规模的AI训练集群,最高可支持4050亿参数的大模型训练任务。安全机制方面,芯片配备双安全根架构及SROOT/OSROOT处理器,支持fTPM和独立TPM,为AI工作负载提供硬件级安全保障。
英伟达透露,GB10是其与联发科合作的成果,CPU IP来自联发科,并在内存访问和能效方面进行了深度优化。该公司还表示,未来该架构有望进一步衍生出面向笔记本电脑与迷你PC等消费级设备的产品,为更广泛的用户带来高效的本地AI计算体验。