滚动资讯

当前位置：网界 > 行业动态 > 正文内容

字节与何恺明团队“同频共振”：Cola DLM开启语言模型连续空间新探索

时间：2026-05-19 22:48 作者：天脉网

大语言模型的发展是否只能依赖“预测下一个token”的路径？字节跳动与何恺明团队近期的研究给出了否定答案。双方不约而同地将目光投向连续语义空间，试图通过新的建模方式突破传统框架的局限。字节跳动推出的Cola DLM（Continuous Latent Diffusion Language Model）更以开源形式释放了论文、代码和模型权重，引发学术界关注。

传统大模型通常将不同表达视为独立样本学习，例如“今天很开心”与“过得挺愉快”会被分别记忆。字节团队认为，这种模式忽略了语义的本质——相同含义的句子应收敛到相近的内部表示。Cola DLM的核心创新在于将语义生成与文本翻译解耦：模型先在连续空间中组织潜在语义，再通过解码器将其转化为具体文字。这一过程跳过了离散token的逐步生成，转而关注语义状态的形成。

研究团队构建了专门的Text VAE架构处理语义与文本的转换：编码器将离散文本压缩为连续潜在变量，解码器则负责还原。与直接操作token嵌入不同，Cola DLM的潜在变量是可概率建模的随机变量，能够捕捉整段文本的语义状态。为避免语义表示退化为“穿马甲的token”，模型在训练中冻结编码器参数，仅让扩散先验适应语义空间，并通过BERT风格的掩码损失防止语义坍塌。

在技术实现上，Cola DLM采用block-causal DiT+Flow Matching组合替代传统扩散模型。该方案通过学习向量场将简单分布（如高斯分布）“运输”至真实语义分布，同时引入块结构平衡局部语义组织与整体逻辑连贯性。实验显示，在约20亿参数、2000 EFLOPs计算量的对照中，Cola DLM展现出比自回归模型和离散扩散模型更稳定的扩展趋势。

研究团队将训练目标拆解为重建、压缩和拟合三个可独立诊断的子任务。这种设计使得模型性能优化更具针对性——当生成效果不佳时，可通过指标快速定位是解码器还原能力不足、语义压缩信息量不够，还是先验分布学习偏差导致。相比之下，传统自回归模型将所有目标混杂在单一损失函数中，难以精准定位问题根源。

与何恺明团队提出的ELF模型相比，Cola DLM展现出不同的技术路径。ELF在原始嵌入空间直接操作，通过反复迭代优化最终生成文本；而Cola DLM则采用分层架构，由语义部门与文本部门分工协作。尽管方法差异显著，但两者均试图突破“token等于语义”的默认框架，探索更适合语言本质的建模空间。

这项研究对多模态统一具有潜在启示。当前跨模态建模的障碍之一在于文本的离散性与图像、视频的连续性存在鸿沟。Cola DLM通过将文本映射至连续语义空间，为不同模态共享潜在表示提供了可能。研究团队在博客中强调，这仅是早期尝试，但连续扩散语言模型已展现出重新定义文本建模方式的潜力。

更多>同类内容

中日创业者沪上聚首共探TikTok短剧与日本市场合作新机遇

05-19

郭晶晶尼格买提探访君乐宝牧场见证高端鲜奶品质悦鲜活加速迈向国际

05-19

ISE两周年庆：徐敬惠称医养与保险产业融合迎黄金期共筑惠民新生态

05-19

长存集团启动IPO辅导：借势AI与算力基建加速布局世界级存算一体基地

05-19

1—4月农业投资增势强劲，多领域投资助力经济高质量发展

05-19

五矿集团布局雄安新动作：中亚南亚资源公司成立注册资本达5亿

05-19

化工行业触底待反转，中长线布局化工行业ETF易方达正当时

05-19

物理AI成未来新风口孙宇晨重金布局 15家高研发潜力概念股引关注

05-19

化工行业触底待反转，化工行业ETF易方达中长期或具成长潜力

05-19

REITs市场绝地反弹创年内最大涨幅，首批指数基金申报或引百亿增量资金入场

05-19

新特电气20CM强势涨停，游资“量化打板”等合计净买入超1亿元

05-19

黄奇帆建议：人民币适度升值+延长带薪休假助力合理调节出口顺差

05-19

东北冻土带新发现稀土矿藏：或为中国稀土产业带来新机遇与新格局

05-19

茅台价格调整新策略：挤走黄牛，让爱酒之人轻松购得佳酿

05-19

宝丰能源业绩飘红：一季度净利增超50% 回应二季度产品价格上行趋势

05-19

点击查看更多 +

全站最新

追觅俞浩谈百BU战略：AI驱动生产力跃升，以N+1模式探索未来边界

长安智能化转型成果显著：L3自动驾驶落地，L4及飞行汽车等未来布局加速推进

百度传统业务遇冷营收下滑，AI新势力崛起成业绩新支柱

百度2026年首季财报亮眼：总营收321亿，AI业务成收入增长新引擎

怀进鹏在世界数字教育大会发声：借人工智能之力，共促全球教育新发展

2026年国产化Agent平台大比拼：功能生态全解析，哪款最适合你的全场景办公？

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号