滚动资讯

当前位置：网界 > 行业动态 > 正文内容

AI早有"自知之明"？新研究唤醒模型沉睡能力，用极简数据实现精准自我评估

时间：2026-06-15 23:14 作者：互联网

在新加坡国立大学与北京工业大学的联合研究中，科学家们探索了一个看似简单却充满挑战的问题：人工智能语言模型能否像人类一样，对自己的回答质量做出准确判断？这项研究以预印本形式发布，论文编号为arXiv:2606.05122，为AI自我评估领域开辟了新的可能性。研究团队发现，经过大规模预训练的AI模型已具备潜在的自我评估能力，只需通过特定方法激活，就能以极少量数据实现高效自我校准。

传统AI训练中，自我评估能力的开发往往依赖大量标注数据，且主要针对数学、编程等有明确标准答案的领域。然而现实场景中，大量问题属于开放性问题，如撰写感谢信或解释气候变化，这类任务缺乏客观评判标准。研究团队突破这一局限，提出名为SEE（Self-evaluation Elicitation）的两阶段训练框架，通过强化学习与掩码蒸馏的循环机制，成功唤醒模型内部的隐性质量感知。

实验采用Qwen3-4B-Base模型作为基础，该模型拥有4亿参数，未经过任何自我评估专项训练。研究人员使用HelpSteer2评分体系，从帮助性、准确性、连贯性、复杂性和详略程度五个维度评估回答质量。在零样本提示条件下，模型预测分数与外部评判者（GPT-5.4）的实际评分吻合度达77.07%，远超随机猜测水平。这一现象类似于未经专业训练的厨师，仅凭经验就能预判菜品评分，表明模型已形成对"优质回答"的隐性认知。

尽管基础模型展现出初步评估能力，但其预测存在显著校准偏差——倾向于给出中等偏高分数，对极端高分或低分预测不足。研究团队通过非线性奖励函数设计解决这一问题：当预测误差增大时，惩罚力度呈指数级增长，迫使模型学习全分数段分布。同时采用严格格式规范，任何不符合[SELF_eval]标签要求的预测直接判为无效，确保训练信号聚焦于质量评估而非回答生成。

SEE方法的核心创新在于其双循环训练机制。第一阶段通过强化学习，模型在生成回答后预测分数，系统根据预测准确度与回答质量给予综合奖励。第二阶段采用掩码蒸馏技术，将模型预测分数替换为评判者实际分数，仅更新自我评估模块参数而冻结回答生成模块。这种设计确保回答质量与评估精度同步提升，避免相互干扰。实验显示，仅需160个训练样本和15轮循环，SEE即可达到传统方法（需5000样本）的校准水平，在三个开放评测基准上分别提升校准得分至0.731、0.746和0.612。

为验证评估能力的普适性，研究团队使用不同评判者（Claude Sonnet 4.6和Gemini 3.1 Flash-Lite）重新评分。结果显示，SEE在所有基准上的相对优势保持稳定，证明其学到的是跨评判者的通用质量感知而非特定偏好。具体案例中，SEE成功纠正基础模型在AK-47类型判断和Anki软件故障排查中的错误，其自我评估分数与评判者实际评分高度吻合，尤其在识别回答缺陷方面表现突出。

该研究对AI系统开发具有双重启示：在技术层面，证明预训练模型已内化质量评估能力，无需从头训练；在应用层面，为AI自主优化回答质量提供新路径。当模型能准确预测外部评判时，可在输出前进行自我筛选，主动标识不确定回答或调整表达方式，显著提升系统可靠性与资源利用率。尽管当前研究存在训练规模较小、依赖AI评判者等局限，但其数据高效的方法论为后续研究指明了方向。

更多>同类内容

金风科技(02208.HK)获摩根大通增持223.62万股

06-15

林清轩(02657.HK)认购光大银行3.7亿元结构性存款产品

06-15

荣利营造(09639.HK)拟6月29日举行董事会会议审批全年业绩

06-15

连连数字(02598.HK)6月15日耗资108.1万港元回购23.45万股

06-15

工商银行(01398.HK)获贝莱德增持2795.53万股

06-15

东方电气(01072.HK)获The Goldman Sachs Group, Inc.增持154.74万股

06-15

基石药业-B(02616.HK)6月15日耗资2.8万港元回购6000股

06-15

双脑分工新突破：机器人“慢半拍”难题破解，控制速度大幅提升

06-15

资本界金控(00204.HK)：5月末每股综合资产净值约为1.662港元

06-15

从“凭感觉”到“凭证据”：Bayesian-Agent让AI智能体经验积累更靠谱

06-15

太初元碁携手上海交大国产算力赋能通用人工智能科研范式革新

06-15

超表面电磁调控技术获突破：降本增效赋能6G及低轨卫星互联领域

06-15

澳门大学等联合研发SwiftVR：消费级显卡实现1080p视频实时高清修复

06-15

阿里巴巴等团队提出Skill-RM方案，为AI“裁判”打造公平精准评分新体系

06-15

无需昂贵传感器！EMMA用视频、声音和图像破解物理世界“密码”

06-15

点击查看更多 +

全站最新

启境汽车获广州L3级自动驾驶路测许可携手华为乾崑共推智能出行新发展

宇树机器人“Pemba”挑战雪山：从钦博拉索起步珠峰之行待启新篇

支付宝政务AI“晓政”服务超1亿次，助力政务升级让群众办事更便捷高效

2026未来汽车AI技术展重庆开幕共探“AI+汽车”创新生态新路径

百度AIDU计划2027届招聘启幕，为学子铺就教育新征程与职业新机遇

吴镇宇柳州探秘东风风行基地深度体验2027款星海V9硬核实力

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号