英伟达开源最强权重模型Nemotron 3 Super:120B参数专攻智能体系统

2026-03-12 09:50:01   |   探索者   |   188

3月12日,英伟达发布Nemotron 3 Super开源大模型,宣称是其迄今为止最强大的开源权重AI模型。该模型拥有1200亿参数,采用混合专家(MoE)架构(推理时仅激活120亿),专为大规模运行复杂智能体系统设计,Perplexity、Palantir、西门子等企业已将其应用于搜索、软件开发、电信和半导体设计等核心工作流。

随着企业AI应用从聊天机器人转向多智能体,面临两大瓶颈:“上下文爆炸”与“推理税”。多智能体交互会产生最多15倍的Token量,导致成本飙升和目标偏移;同时,复杂智能体每步都需要推理,让系统变得昂贵且迟钝。Nemotron 3 Super配备100万Token上下文窗口,让智能体能够将完整工作流状态保留在内存中,防止目标偏移并大幅降低多步推理成本。

在架构方面,该模型采用混合专家架构,将吞吐量提升5倍,准确率比前代翻倍。其Mamba层使内存和计算效率提高4倍,Transformer层负责高级推理。“潜在MoE”新技术以单个专家的计算成本激活四个专家;多Token预测让推理速度提升3倍。在英伟达Blackwell平台上,该模型以NVFP4精度运行,相比Hopper架构上的FP8,内存需求更低且推理速度快4倍。

英伟达采取了高度开放的策略,不仅遵循宽松许可证开源模型权重,还公布了完整训练方法,包括超过10万亿Token的数据集和评估配方。在实际场景中,它能一次性加载完整代码库进行端到端调试,或瞬间读取数千页财务报告。



特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

英伟达开源最强权重模型Nemotron 3 Super:120B参数专攻智能体系统

2026-03-12 09:50:01 浏览量: 188 作者: 探索者

3月12日,英伟达发布Nemotron 3 Super开源大模型,宣称是其迄今为止最强大的开源权重AI模型。该模型拥有1200亿参数,采用混合专家(MoE)架构(推理时仅激活120亿),专为大规模运行复杂智能体系统设计,Perplexity、Palantir、西门子等企业已将其应用于搜索、软件开发、电信和半导体设计等核心工作流。

随着企业AI应用从聊天机器人转向多智能体,面临两大瓶颈:“上下文爆炸”与“推理税”。多智能体交互会产生最多15倍的Token量,导致成本飙升和目标偏移;同时,复杂智能体每步都需要推理,让系统变得昂贵且迟钝。Nemotron 3 Super配备100万Token上下文窗口,让智能体能够将完整工作流状态保留在内存中,防止目标偏移并大幅降低多步推理成本。

在架构方面,该模型采用混合专家架构,将吞吐量提升5倍,准确率比前代翻倍。其Mamba层使内存和计算效率提高4倍,Transformer层负责高级推理。“潜在MoE”新技术以单个专家的计算成本激活四个专家;多Token预测让推理速度提升3倍。在英伟达Blackwell平台上,该模型以NVFP4精度运行,相比Hopper架构上的FP8,内存需求更低且推理速度快4倍。

英伟达采取了高度开放的策略,不仅遵循宽松许可证开源模型权重,还公布了完整训练方法,包括超过10万亿Token的数据集和评估配方。在实际场景中,它能一次性加载完整代码库进行端到端调试,或瞬间读取数千页财务报告。



,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号