滚动资讯

当前位置：网界 > 行业动态 > 正文内容

AI大模型"记忆压缩"新突破：无需预设阈值，动态适配各类任务需求

时间：2026-07-04 09:14 作者：互联网

当用户与智能助手对话时，AI需要持续跟踪对话历史以生成连贯回应，这种“记忆”功能依赖名为KV缓存的技术实现。然而，大型语言模型在处理长文本时，显存消耗呈指数级增长——以700亿参数模型为例，仅存储2万个词的上下文就需要50GB显存，相当于同时运行数十个高清游戏。如何平衡内存占用与性能表现，成为人工智能领域亟待突破的技术瓶颈。

传统压缩方案通过预设固定比例削减缓存，犹如要求学生在考试前就确定草稿纸使用量。研究团队在数学推理、科学问答、对话系统等13类任务中测试H2O、StreamingLLM等主流方法时发现，当保留比例设为50%时，H2O在数学题集GSM8K上的准确率骤降至41%，但在对话任务CoQA中仍保持99%的高水准。这种“一刀切”策略在混合任务场景中表现尤为脆弱，实际部署时难以应对用户提问类型的动态变化。

针对这一难题，研究团队提出“无阈值压缩”新范式，开发出ReFreeKV技术框架。该方案包含两个创新机制：首先是基于位置的重要性排序，将序列开头的核心描述词与末尾的最新信息优先保留，中间过渡性内容置于次要位置；其次引入“注意力健康度”评估体系，通过监测注意力矩阵的Frobenius范数变化，当信息损失超过1%时自动终止压缩。这种动态调整机制使模型能根据任务复杂度自主决定记忆容量，如同智能速记员根据会议内容自动调整笔记详略。

实验数据显示，在Llama3-8B模型上，ReFreeKV平均节省36.32%显存的同时，任务准确率反而提升0.12%。更引人注目的是其自适应特性：在数学推理任务中自动保留90%以上缓存，而在文本摘要任务中仅需15%的存储空间。相比之下，固定比例方法在预算压缩至20%时，数学任务准确率普遍跌至个位数，暴露出传统方案在开放域场景中的根本缺陷。

该技术的工程实现包含多项优化设计。为避免基础信息丢失，系统强制保留模型前两层的完整缓存；通过仅计算最后一行注意力分数替代全矩阵运算，将复杂度从O(n²)降至O(1)，使长文本处理效率显著提升。在批量推理测试中，ReFreeKV使系统吞吐量提升10%-20%，且优势随并发请求增加持续扩大，为商业部署提供了关键性能支撑。

尽管ReFreeKV在多数场景中表现优异，研究团队也指出其现存局限。在Mistral-7B模型的文本摘要任务中，系统保留了84.3%的缓存，而实验表明50%的存储空间已足够维持性能，显示压缩策略仍偏保守。当前方案依赖经验性设定的1%阈值，尚未建立严格的数学证明体系，这将成为后续研究的重要方向。

这项突破对人工智能应用产生深远影响。在智能客服、代码生成等实际场景中，更高效的内存管理可直接降低硬件成本，提升服务响应速度。以GitHub公开的Patrick-Ni/ReFreeKV项目代码为基础，开发者已能复现相关实验，推动自适应压缩技术向更多模型架构迁移。随着技术迭代，未来或可实现显存占用与任务难度的精准匹配，为通用人工智能发展奠定基础架构支撑。

更多>同类内容

AI生成图像视频：真懂物理规律，还是仅会“照猫画虎”？

07-04

港科大等高校联合研究：AI视频理解“时序推理”短板暴露无遗

07-04

耶路撒冷希伯来大学新发现：语音AI竟在内部悄悄“翻译”文字思考

07-04

复旦、上交大等高校联合研发A2World，为机器人装上“预演未来”的智慧大脑

07-04

快递行业首个L4自动驾驶重卡载货示范

07-04

消息称苹果带摄像头AirPods Pro项目“暂停”

07-04

生数科技发布Vidu S1实时交互模型，支持实时视频通话

07-04

微信鸿蒙版App获8.0.19.35正式版更新

07-04

两部门发文鼓励电影院多样化经营，支持放映虚拟现实电影

07-04

LME金属多数收涨

07-04

数字化转型浪潮下，企业云计算领域不可错过的十大核心技能解析

07-04

AWS Summit纽约峰会落幕：生成式AI热议不断，云计算真实需求何解？

07-04

宇树科技科创板IPO注册获批，拟募42亿，或成A股人形机器人领域领跑者

07-04

上期所原油期货夜盘收跌0.16%

07-04

恒指期货夜盘收跌0.2%

07-04

点击查看更多 +

全站最新

冠盛股份国内电商三店齐开布局新零售开拓线上新赛道

新款福特探险者7月6日上市！2.3T配10AT，车长超5米，配置再升级！

国士无双！陈俊武扎根洛阳半世纪，科技报国精神照亮后人前行路

盛夏启程探秘境，山海相逢品佳肴，解锁暑期奢愈新体验

MastaJi马思荅吉：以技术实力与服务优势，助力新疆智慧校园建设升级

河南智慧校园建设选哪家？MastaJi马思荅吉技术实力强服务优值得考虑

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号