英伟达首批Vera CPU正式交付Anthropic、OpenAI、SpaceXAI及甲骨文
5月19日,英伟达宣布,其首批Vera CPU已于上周五及本周一开始向各大AI公司发货,标志着这款专为Agentic AI设计的处理器正式进入量产阶段。英伟达超大规模与高性能计算副总裁伊恩·巴克亲手将首批Vera CPU系统交付给Anthropic、OpenAI、SpaceXAI和甲骨文云基础设施。
Vera是英伟达首款定制CPU,专为Agentic AI打造。它采用88个英伟达自研的奥林巴斯核心,内存带宽达1.2 TB/s,满负载下单核性能比前代Grace快50%。在Anthropic位于SoMa区的办公室,Anthropic计算负责人詹姆斯·布拉德伯里接收了服务器,并表示计算规模的扩展是模型增长的重要加速器,Vera在解决Agentic工作负载方面将成为生态系统中一个有前途的组成部分。
在OpenAI的Mission Bay总部,OpenAI计算基础设施负责人萨钦·卡蒂感谢巴克送来服务器。巴克甚至现场掏出螺丝刀打开机箱盖,展示了系统内部结构。当天最后一站是SpaceXAI位于帕洛阿尔托的办公室,马斯克亲自签收,并询问了核心数量、内存布局及散热方案等内容。SpaceXAI正在评估Vera在强化学习工作负载和基于智能体的仿真管道中的表现。
本周一,在甲骨文AI客户卓越中心,OCI团队也查看了开箱后的Vera CPU系统。据介绍,甲骨文是首家超大规模部署Vera的云服务商。Karan Batta表示,甲骨文云计划从2026年开始部署数十万颗Vera CPU,因为Agentic AI需要在大规模下维持持续性能。
英伟达副总裁伊恩·巴克表示,Agentic AI正在AI工厂中缔造一个新的CPU时刻。当AI模型被提问时,答案往往不是预先准备好的,模型需要生成Python代码才能得出正确答案,这正是CPU需求飙升的原因。Vera CPU可提供极高的单线程核心性能、数据输出能力及能效水平,是全球首款也是唯一一款采用LPDDR5内存的数据中心CPU。
Vera CPU采用英伟达下一代定制Arm架构(奥林巴斯),配备88个核心、176个线程、1.8 TB/s的NVLink-C2C一致性内存互连、1.5 TB系统内存(是Grace的3倍),以及1.2 TB/s内存带宽。这些特性使数据处理、压缩及CI/CD性能相比Grace提升约2倍。
Vera是英伟达极致协同设计的一部分,与Rubin GPU、BlueField 4 DPU、Spectrum-X和MGX机架架构并列。除了支持独立的CPU系统外,Vera还是Vera Rubin NVL72的主机处理器,通过第二代NVLink-C2C与两颗Rubin GPU配对。随着Vera进入全面量产阶段,Vera Rubin平台计划于本周后半段发布,首批机架的大规模生产即将开始。Agentic AI时代迎来了一款专门为其打造的CPU——Vera。