谷歌推出DiffusionGemma:本地AI推理速度提升4倍,开源文本扩散模型

2026-06-11 09:07:19   |   Google   |   1005

今日,谷歌发布公告,宣布推出DiffusionGemma——一款基于文本扩散机制的开放AI模型。与当前主流的自回归大语言模型(如GPT、Gemini)逐个生成token的方式不同,扩散模型通过从噪声中逐步去噪并行处理所有token,在本地低带宽计算环境下具有显著的推理速度优势。据介绍,DiffusionGemma的本地推理速度相比自回归模型提升了4倍。

该模型采用Apache 2.0许可证开源,用户可从Hugging Face下载模型权重。在性能表现上,DiffusionGemma的采样速度达到1479 tokens/秒,生成效率显著提升。代码生成方面,HumanEval达到89.6%,与Gemini 2.0 Flash-Lite互有胜负;数学能力表现亮眼,AIME 2025取得23.3%,超越对比模型的20.0%。不过模型在科学推理GPQA Diamond上仅为40.4%,明显低于对比模型的56.5%。

英伟达官方博文指出,该模型能充分发挥GPU的Tensor Core并行计算能力,在单块H100 GPU上达到每秒1000个token的生成速度,在DGX Station上可达每秒2000个token。谷歌表示,DiffusionGemma还支持迭代优化,能在生成过程中主动纠正错误,输出更加稳定一致。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

谷歌推出DiffusionGemma:本地AI推理速度提升4倍,开源文本扩散模型

2026-06-11 09:07:19 浏览量: 1005 作者: Google

今日,谷歌发布公告,宣布推出DiffusionGemma——一款基于文本扩散机制的开放AI模型。与当前主流的自回归大语言模型(如GPT、Gemini)逐个生成token的方式不同,扩散模型通过从噪声中逐步去噪并行处理所有token,在本地低带宽计算环境下具有显著的推理速度优势。据介绍,DiffusionGemma的本地推理速度相比自回归模型提升了4倍。

该模型采用Apache 2.0许可证开源,用户可从Hugging Face下载模型权重。在性能表现上,DiffusionGemma的采样速度达到1479 tokens/秒,生成效率显著提升。代码生成方面,HumanEval达到89.6%,与Gemini 2.0 Flash-Lite互有胜负;数学能力表现亮眼,AIME 2025取得23.3%,超越对比模型的20.0%。不过模型在科学推理GPQA Diamond上仅为40.4%,明显低于对比模型的56.5%。

英伟达官方博文指出,该模型能充分发挥GPU的Tensor Core并行计算能力,在单块H100 GPU上达到每秒1000个token的生成速度,在DGX Station上可达每秒2000个token。谷歌表示,DiffusionGemma还支持迭代优化,能在生成过程中主动纠正错误,输出更加稳定一致。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号