谷歌推出DiffusionGemma：本地AI推理速度提升4倍，开源文本扩散模型

2026-06-11 09:07:19 | Google | 1010

今日，谷歌发布公告，宣布推出DiffusionGemma——一款基于文本扩散机制的开放AI模型。与当前主流的自回归大语言模型（如GPT、Gemini）逐个生成token的方式不同，扩散模型通过从噪声中逐步去噪并行处理所有token，在本地低带宽计算环境下具有显著的推理速度优势。据介绍，DiffusionGemma的本地推理速度相比自回归模型提升了4倍。

该模型采用Apache 2.0许可证开源，用户可从Hugging Face下载模型权重。在性能表现上，DiffusionGemma的采样速度达到1479 tokens/秒，生成效率显著提升。代码生成方面，HumanEval达到89.6%，与Gemini 2.0 Flash-Lite互有胜负；数学能力表现亮眼，AIME 2025取得23.3%，超越对比模型的20.0%。不过模型在科学推理GPQA Diamond上仅为40.4%，明显低于对比模型的56.5%。

英伟达官方博文指出，该模型能充分发挥GPU的Tensor Core并行计算能力，在单块H100 GPU上达到每秒1000个token的生成速度，在DGX Station上可达每秒2000个token。谷歌表示，DiffusionGemma还支持迭代优化，能在生成过程中主动纠正错误，输出更加稳定一致。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。