滚动资讯

当前位置：网界 > 行业动态 > 正文内容

AI编程效果差？别急着换模型！装上Harness，让智能体稳定“输出”

时间：2026-05-24 09:25 作者：格隆汇

在人工智能领域，一个名为Harness的工程基础设施正引发广泛关注。Anthropic和OpenAI近期通过独立实验证实，AI编程智能体性能瓶颈往往不在模型本身，而在于缺乏完善的Harness系统。这一发现正在改变行业对AI开发范式的认知。

Anthropic的对照实验极具说服力：使用相同的Opus 4.5模型解决同一编程问题时，裸跑模式仅需9美元成本，但代码通过率不足20%；而搭载Harness系统后，虽然成本增至200美元，代码通过率却飙升至92%。这多出的191美元主要消耗在验证循环上——系统自动执行测试、修正代码，直至通过所有检查。

OpenAI的百万行代码实验同样印证了这一结论。研究团队仅在代码仓库根目录添加了一个不到100行的AGENTS.md文件，就使智能体的代码质量产生质的飞跃。这个看似简单的配置文件，实则构建了完整的工程约束体系。

Harness系统的核心是五大工程子系统：指令系统通过标准化文档注入项目规范，防止代码风格混乱；工具系统严格限定可执行命令，避免误删文件等灾难性操作；环境系统锁定依赖版本，消除"本地能跑但CI失败"的虚假环境；状态系统持久化开发进度，解决跨会话信息丢失问题；反馈系统强制执行测试流程，杜绝"自我感觉良好"的虚假完成。

行业实践显示，智能体开发存在三大致命缺陷：过早宣布任务完成、上下文压力导致的质量崩塌、跨会话信息断层。Anthropic的裸跑实验中，智能体常在未通过类型检查时就宣称完成开发，这正是缺乏强制反馈机制的结果。而状态系统的缺失，则会导致不同开发会话间产生功能冲突。

构建基础Harness系统并不复杂。开发者只需在项目根目录创建AGENTS.md文件定义规范，通过配置文件限制可执行命令，编写环境锁定脚本，建立PROGRESS.md记录开发状态，最后在AGENTS.md中明确完成标准——必须通过类型检查、单元测试、代码规范审查和构建流程。这整套配置通常不超过200行代码。

实验数据显示，未建立反馈循环的Harness系统形同虚设。Anthropic的失败案例表明，即使前四个子系统部署完善，若缺少强制测试流程，代码通过率仍会低于30%。这印证了行业共识：Harness不是可选配件，而是AI工程化的基础设施。

当前技术格局下，模型能力决定性能上限，而Harness系统决定实际利用率。没有工程约束时，顶尖模型生成的代码可能连编译都无法通过；完善的Harness系统却能让次优模型稳定交付。这种工程化思维正在重塑AI开发流程——在追求更强模型之前，先构建可靠的工程基础设施已成为行业新准则。

更多>同类内容

上海疾控人工智能成果闪耀世界卫生大会智慧守护超大城市健康防线

05-24

长三角携手攻坚：航空液压泵“卡脖子”难题迎突破曙光

05-24

无锡万象城盒马鲜生6月18日试营业，西区6月底开业引期待！

05-24

ThinkPad E14 Gen 8北美发布，双硬盘插槽与DDR5内存升级潜力如何？

05-24

三星海力士杠杆ETF即将上市分析人士：韩国千万散户需求旺盛

05-24

联明股份2025年报：营收利润双增研发投入与人员减少引关注

05-24

中科曙光2025年研发投入超16亿创新驱动业绩增长赋能行业数字化转型

05-24

大豪科技2025年成绩亮眼：研发投入超2亿，营收净利双增还拟派现

05-24

石大胜华2025年研发投入2.71亿增13.75% 新能源领域创新突破成果显著

05-24

安孚科技2025年营收净利双增研发投入虽降但人员扩增聚能环5代稳固市场地位

05-24

德新科技2025年研发投入大增48.63% 业绩与业务拓展齐头并进

05-24

如通股份2025年研发投入稳增创新驱动营收净利双提升

05-24

台华新材2025年研发投入降营收减精准研发促技术突破与产品迭代

05-24

麦加芯彩2025年研发投入缩减专利成果与新能源板块收入创新高

05-24

禾望电气2025年研发投入加码，技术突破助力业绩营收双增长

05-24

点击查看更多 +

全站最新

科大讯飞AI眼镜：以技术革新破局，凭场景适配出圈，入选2026年度AIGC关注榜

文博会上温州鹿城“大放异彩”：老手艺邂逅黑科技，共谱“海丝”新篇

昇腾AI开发者峰会2026北京启幕：共探Agentic AI新未来携手构建开发者生态

海澜之家年轻化转型困境：依赖女性营销，难破“他”消费壁垒

从辉煌到破产：拉勾网曾助力罗永浩还债，今却走到行业尽头

家长变身“校园老师” 重庆财经学院家校共育新模式受学生热捧

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号