滚动资讯

当前位置：网界 > 行业动态 > 正文内容

谷歌另辟蹊径：用扩散模型写文字，速度飙升4倍开启新可能

时间：2026-06-12 00:43 作者：快讯

当业界还在聚焦“AO”两家大模型激烈竞争时，谷歌已悄然在文本生成领域投下一枚重磅炸弹——基于扩散模型的DiffusionGemma正式开源。这款突破传统自回归架构的模型，通过并行生成机制实现每秒千token级输出，在消费级显卡上即可流畅运行，为本地化AI应用开辟了全新路径。

传统自回归模型采用“逐字输出”的打字机模式，每个新token的生成都需要重新加载全部模型参数，导致GPU算力长期处于闲置状态。这种内存带宽瓶颈在本地单用户场景尤为突出，成为制约生成速度的核心难题。DiffusionGemma则创造性地将图像生成领域的扩散模型引入文本领域，通过256token的并行生成画布，实现多轮去噪的批量处理，使计算效率产生质的飞跃。

在H100显卡的实测中，DiffusionGemma以1000+ token/s的速度碾压传统架构，较同参数规模模型提升4倍性能。更令人瞩目的是其硬件友好性：260亿参数的混合专家模型在推理时仅激活38亿参数，量化后18GB显存即可运行，这意味着普通用户的RTX 4090显卡就能承载完整模型。这种设计直接打破了高算力门槛，使个人开发者也能部署前沿生成技术。

该模型的创新不止于速度。其双向注意力机制赋予每个token全局视野，在生成过程中即可实时评估上下文一致性。这种“所见即所得”的生成模式，在处理需要前后文联动的任务时展现惊人优势：经过微调的模型在数独求解任务中成功率从0%跃升至80%，在代码补全、复杂格式排版等场景中更显潜力。谷歌工程师形象地比喻，这相当于将打字机升级为高速印刷机。

尽管在文本质量基准测试中，DiffusionGemma仍与主流自回归模型存在差距，但谷歌明确将其定位为速度敏感型场景的解决方案。这种务实定位获得产业界积极响应，NVIDIA全面适配从消费级到专业级的全系显卡，vLLM、MLX等主流推理框架同步支持，形成完整的硬件-软件生态闭环。开源社区更在24小时内涌现出多个优化版本，展现出极强的技术延展性。

值得注意的是，谷歌并非首个探索该路径的机构。初创公司Inception Labs今年2月发布的Mercury 2模型已展示类似思路，而谷歌去年I/O大会的Gemini Diffusion实验更早埋下伏笔。此次DiffusionGemma的突破性进展，标志着扩散模型在文本生成领域真正走向实用化。随着llama.cpp等轻量化框架的适配推进，这场由并行计算引发的生成革命，或将重塑AI应用的硬件格局。

项目地址：https://huggingface.co/unsloth/diffusiongemma-26B-A4B-it-GGUF
技术文档：https://unsloth.ai/docs/models/diffusiongemma

更多>同类内容

字节AI手机项目核心硬件负责人林夕离职曾主导华为爆款折叠机设计

06-12

公安部就无人机处罚新规征求意见，涉及黑飞等多类违规行为

06-12

成本压力难扛！华为等厂商7月起全线涨价消费电子行业陷入两难困境

06-12

OPPO首款阔折叠屏手机开案测试：尺寸比肩苹果定价万元开启新赛道探索

06-12

江门地下700米：JUNO探测器“捕捉”中微子解20年宇宙存在之谜

06-12

6月“长庚星”闪耀西方夜空地平高度达峰值观赏正当时

06-12

于六便士中寻生活真谛，在仰望月亮时守内心热爱

06-12

国际宇航科学院发布外星探测新规：谨慎回应，国际共商护地球安全

06-12

航天员太空带枪之谜：防的不是外星人，而是源于苏联的深刻教训

06-12

六年蝶变绘蓝图：成都未来科技城如何崛起为西部航空航天产业新高地？

06-12

从看电影到"玩"电影，现存电影相关企业超173万家

06-12

两颗奇异白矮星现五大共同特征或定义全新恒星遗迹类别

06-12

长白山旧石器遗址群：石器骨器镌刻万年文明，诉说远古人类智慧

06-12

台北电脑展新亮点：华硕ROG CROSSHAIR X870E EDITION 20主板支持9块M.2固态硬盘

06-12

朱雀2E遥六成功入轨蓝箭航天迈入星座发射真实交付新阶段

06-12

点击查看更多 +

全站最新

阿里钉钉换帅陈宇森接棒：AI Native浪潮下，以“人”为本重塑组织新篇

从学霸到阿里最年轻CEO：陈宇森能否用AI思维重塑钉钉未来？

钉钉换帅陈宇森掌舵，AI Agent战略下飞书企业微信面临新挑战

千问高考志愿Agent免费上线：以AI之力守护教育公平与选择尊严

京东A2P2协议发布：智能体自主支付有规则可循，资金安全追溯无忧

北京地铁回应张雪事件：闸机防夹未关时插卡，无效票卡被退引误会

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号