近期,AI领域因一个名为“loop工程”的新概念引发广泛讨论。这一概念由OpenClaw创始人斯坦伯格在社交平台提出,他主张用“设计循环”替代传统提示词工程,认为循环结构能让AI代理更高效地完成任务。然而,这一观点并未立即获得广泛认同,反而引发了技术圈的激烈争论,部分从业者质疑其可行性,也有人批评其为“概念炒作”。
争议的核心在于资源消耗与实际应用场景的矛盾。反对者指出,循环机制需要大量计算资源,若缺乏无限token支持,最终仍需人工介入测试。距离上一个热议概念“harness工程”仅过去一两个月,行业尚未完全消化旧知识,新概念的快速迭代加剧了从业者的认知负担。尽管如此,斯坦伯格的推文仍获得超800万次浏览,显示出市场对AI技术范式变革的高度关注。
追溯概念起源,loop工程最早由Claude Code创始人鲍里斯提出。他在访谈中透露,自己已不再手动编写提示词,而是通过设计循环让AI代理自主判断修改方向。这种模式的核心在于将“指令”转化为“目标”:AI代理通过目标设定、行动执行、结果观察、效果评估、方案修正的闭环流程,逐步逼近预期结果。与传统编程循环不同,AI代理的每一步行动均基于动态反馈,而非固定代码逻辑,这使其能应对现实世界中充满不确定性的复杂任务。
以代码开发为例,传统编程需预先设计所有分支逻辑,而AI代理的循环机制允许其通过试错学习。例如,澳洲开发者杰弗里·亨特利利用名为“ralph”的bash脚本,通过固定上下文锚点文件实现迭代优化,仅花费297美元便构建出完整编程语言。这一案例证明,循环的核心价值在于创造可持续改进的环境,使AI代理能在多轮迭代中积累进展,而非追求单次完美输出。
2026年,Codex和Claude Code将这一理念产品化,推出“/goal”命令,支持循环运行直至验证通过。但斯坦伯格的设想更进一步:他提出将循环作为长期运行的工作单元,构建可协作、自调度的AI系统。例如,一个持续运行的循环可每日检查代码仓库问题,自动分配修复任务,运行测试并提交合并请求。当多个循环并行时,系统会通过总循环协调优先级、监控进度并检查质量,形成层级化工作流。
这场争论也触及提示词工程的定位。尽管清晰具体的提示词仍是与AI交互的基础,但单次提示词的重要性正在下降。现实场景中,需求往往在执行过程中逐步明确,例如测试阶段才能发现的漏洞,或实际使用中暴露的缺陷。循环机制通过定义目标与评估标准,使AI代理能在多轮迭代中自主优化,减少对人工引导的依赖。例如,生成登录页面时,提示词工程需一次性提供所有细节,而循环工程可通过自动化测试、视觉检查等步骤逐步完善功能。
构建有效的循环系统需设计五大组件。首先是明确的目标,例如“将接口响应时间从800毫秒降至300毫秒以下”,而非模糊的“优化性能”。其次是上下文管理,需筛选代码状态、测试结果等关键信息,避免无关内容干扰决策。第三是工具选择,仅提供必要工具以降低决策复杂度,例如代码生成循环需配备测试运行工具。第四是自动化评估,通过量化标准判断结果是否达标,同时保留人工检查点处理主观性较强的任务。最后是停止条件,包括成功达标、连续失败、资源耗尽等场景,以及高风险操作前的人工确认环节。
目前,基于git的状态管理已成为循环系统的常见实践,通过记录历史提交帮助AI代理理解决策逻辑。这种设计使AI工作模式从“一次性任务”转向“持续流程”,为自动化处理开放性任务提供了新范式。尽管争议仍在继续,但循环机制在代码修复、研究探索等领域展现的潜力,正推动行业重新思考人机协作的边界。






