AI圈内热炒的Loop Engineering到底是什么？它真的能成为第四套AI领域共识体系吗？

程序员王饱饱

221人浏览 · 2026-06-17 20:25:01

程序员王饱饱 · 2026-06-17 20:25:01 发布

最近 AI 圈又开始热炒一个概念：Loop Engineering。

原因也不难理解。

Google 的 Addy Osmani 写了一篇文章，把 Loop Engineering 放在 Context Engineering 和 Harness Engineering 之后讨论；Anthropic 这边也一直在讲长任务 Agent、有效 Harness、Context 管理和长时间运行的工程边界。于是很多人很快把这件事包装成了“第四套 AI 领域共识体系”。

我对这个说法保留意见。

不是因为 Loop Engineering 没价值。

恰恰相反，Loop 思路在 AI Coding、长期任务执行、多 Agent 协作和无人值守项目推进里都很有用。

问题在于，别每次一看到新词就急着立山头，这样很容易把工程问题讲成概念竞赛，真实的意义不大。

我更倾向于这样理解：

Loop Engineering 解决的是“如何让 Agent 在无人盯守的情况下持续推进任务，并在每次循环中回到目标、状态、证据和下一步”。

放在更完整的工程体系里，它更像 Harness 工程里的调度层和回拉机制，而不是一套全新的方法论。

如果你的 Harness 已经具备清晰的目标、Spec、台账、上下文包、执行计划、状态文件、回归测试、代码审查、异常复盘和 Release 证据，那么 Loop 缺的东西并不神秘：一个能定时触发、读取状态、生成下一步任务、执行、验证、写回状态的调度机制。

真正困难的地方也不在“定时触发”。

定时脚本不贵，cron 也不稀奇。困难的是：Agent 连续跑 12 小时、24 小时甚至更长时间以后，是否还沿着最初的产品架构、模块拆解、功能边界和验收目标往前推进，而不是陷进某个按钮样式、某段 SQL、某个小 bug 里反复打磨，最后忘掉项目原本要做什么。

这篇文章我想拆的就是这个问题。

• Loop Engineering 到底是什么？
• 它和 Context Engineering、Harness Engineering 的关系是什么？
• 它在 AI Coding 里真正能解决什么？
• 落地时最容易跑偏的地方在哪里？
• 以及我们应该怎样用更务实的方式，把 Loop 放回 Harness 工程里，而不是跟着概念热度继续喊口号。

一、Loop Engineering 到底在讲什么

Addy Osmani 对 Loop Engineering 的定义很有意思。

他没有把它讲成“写一个 while true 的脚本”。他更强调一种系统：这个系统会提示 Agent、读输出、更新状态、等待、再提示，如此循环，让 Agent 在无人盯守的情况下持续推进工作。

这比普通自动化多了一层。

普通自动化通常执行固定流程：到点运行脚本，抓数据、发消息、跑任务、生成报告。流程稳定，输入输出相对确定，异常处理也相对明确。

Loop Engineering 面向的是更开放的 Agent 工作流。

Agent 每一轮不只是执行固定动作，还需要读取当前项目状态，判断下一步，调用工具，写代码，跑测试，修复问题，更新进度，然后把新的状态交给下一轮。

这类循环一般会包含几类组件：

• 一个明确的长期目标；
• 一个可以被 Agent 读取的当前状态；
• 一个任务分解和优先级机制；
• 一个可执行的工具环境；
• 一个结果验证机制；
• 一个状态写回机制；
• 一个下一轮调度机制；
• 一个异常停止或人工接管边界。

如果只看最后一项，Loop 似乎就是定时任务。

但工程上真正值钱的是前面几项。

没有长期目标，循环会变成随机游走。

没有状态文件，下一轮 Agent 只能靠压缩后的上下文猜。

没有任务拆解，Agent 很容易把“继续推进项目”理解成“继续打磨刚才看到的局部”。

没有验证机制，它可能每轮都宣布完成。

没有人工接管边界，它可能在错误方向上越跑越远。

所以 Loop Engineering 的关键词不该只是 loop。

更准确的关键词应该是：目标、状态、调度、验证、回写、回拉。

二、为什么我不把它看成第四套共识体系

过去两年，AI 工程领域已经出现过几条很重要的共识线。

第一条是 Prompt Engineering。

它解决的是如何把任务描述清楚，让模型更稳定地理解意图、格式、约束和输出要求。

第二条是 Context Engineering。

它解决的是模型在有限上下文窗口里应该拿什么信息、以什么顺序拿、拿到什么粒度、哪些信息该进入当前轮次、哪些信息应该延迟展开。

第三条是 Harness Engineering。

它解决的是如何把 Agent 放进一套可验证、可追踪、可审查、可恢复的工程系统里，而不是把任务一次性丢给模型后等它自己“悟”。

Loop Engineering 当然有自己的位置，但把它抬成“第四套共识体系”，我觉得有点过度包装。

如果把 Harness 定义得很窄，只把它理解成单次 Agent 执行环境，那么 Loop 确实像更上层的调度体系。它负责让 Agent 多次启动、多轮推进、跨 Session 延续状态。

但如果把 Harness 定义成完整的 Agent 工程控制系统，Loop 很自然就是其中的一个子系统。Harness 本来就应该包含：

• 目标定义；
• 任务拆解；
• 上下文装载；
• 执行入口；
• 工具权限；
• 状态记录；
• 测试验证；
• 异常处理；
• 复盘和回归；
• 交付证据。

Loop 只是在这个体系里进一步强调“跨时间的持续调度”。

换句话说，Loop 的价值不在重新发明一套工程哲学，而在补上一个过去大家容易忽略的能力：Agent 不一定要在一个 Session 里把所有事情做完，它可以按固定节奏醒来、读取状态、继续推进、验证结果、写回状态，再等下一轮。

这很实用。

但实用不等于它应该被包装成全新共识。

很多所谓新概念的泡沫，常常来自把一个工程子能力单独命名，然后忘掉它依赖的上下文、状态、验证和边界。Loop Engineering 如果脱离 Harness，最后很容易退化成“定时唤醒一个 Agent 继续干活”。

这种做法能演示，项目一复杂就会出问题。

三、单 Session 长任务和 Loop 调度，本质上是两种实现路线

很多人会问：既然 Loop 是定时调度，那是不是就不需要优化单 Session 长任务能力了？

我的判断是，两条路线都成立，适用场景不同。

第一条路线，是强化单 Session 的长任务执行能力。

比如你给 Agent 一个完整 Spec、一份台账、一组任务优先级、一套开发规范、一套测试命令和验收标准，让它在一个 Session 里持续推进。只要上下文管理、目标回拉、任务台账和验证机制设计得好，一个 Session 跑十几个小时甚至更久并非不可行。

这种模式的好处是连续性强。Agent 在同一个上下文里能保留比较多的即时细节，修复、验证、再修复的局部闭环更顺。

代价也明显。上下文会越来越长，compact 会损失细节。任务越复杂，越需要它不断把状态写到文件里，否则长时间运行以后很容易丢目标、丢边界、丢阶段判断。

第二条路线，是通过 Loop 进行跨 Session 调度。

比如每隔 30 分钟、1 小时、3 小时唤醒一次 Agent。每次启动时，Agent 先读取项目 Wiki、Spec、台账、当前状态、最近变更、失败案例和下一步建议，然后执行一个有限任务，跑完测试和 Review，再把状态写回。

这种模式的好处是对单次上下文长度要求更低。每一轮都可以更像一个短任务，失败后也更容易隔离。你不需要指望一个 Session 自己扛完整个项目生命周期。

代价在于状态设计必须更硬。每一轮 Agent 都像“新来的同事”，如果项目状态文件写得含糊，下一轮就会误解目标。Loop 调度越频繁，状态文件、任务台账、验收证据和主线回拉越重要。

所以单 Session 长任务和 Loop 调度不是路线对立。

它们是 Harness 工程下的两种实现方式。

项目小、任务连续、上下文可控，可以优先强化单 Session。项目周期长、执行间隔大、需要无人值守，可以引入 Loop。更成熟的做法通常是两者结合：Session 内有台账和自我调度，Session 外有定时唤醒和状态恢复。

四、Loop 真正的难点：持续执行时不跑偏

以一个“会员积分小程序”的开发为例。

用户真正要的是一套能跑起来的产品，而不是某个页面局部打磨：

• 用户端能注册、登录、查看积分、兑换权益；
• 商家端能配置积分规则、活动规则、兑换商品；
• 管理端能看用户、积分流水、订单和异常记录；
• 后端能维护积分账户、流水、冻结、核销和回滚；
• 前端能按原型和设计规范完成页面；
• 数据模型能支撑查询、审计和后续扩展；
• 测试能覆盖积分变更、重复提交、异常回滚、权限边界。

如果 Agent 没有 Harness，Loop 跑起来以后很容易发生几类偏移。

第一类偏移，是局部细节吞掉主线。

Agent 可能盯着某个页面 UI 一直优化，反复调按钮、边距、文案和 loading 状态，却忘了积分账户模型还没完成，商家规则还没落地，管理后台还没有权限控制。

第二类偏移，是短期错误吞掉长期目标。

某个测试失败以后，Agent 连续几轮都在修同一个局部问题。问题可能确实存在，但项目层面的优先级已经被局部 bug 绑架。12 小时以后，它也许解决了一个边缘问题，却没有推进核心模块。

第三类偏移，是上下文压缩导致目标变形。

最初 Spec 里写了“会员积分小程序”，中途为了修功能提到“积分明细页”。压缩后 Agent 可能把任务理解成“继续完善积分明细页”，而不是回到完整小程序目标。

第四类偏移，是执行证据不足导致虚假完成。

Agent 改了代码，认为功能完成，但没有跑测试，没有真实打开页面，没有走用户流程，没有检查数据写入，没有验证异常回滚。Loop 下一轮读取到“已完成”，后面的问题会越来越深。

这些问题不靠“循环”解决。

循环只会放大系统已有的优点和缺陷。

Harness 完备，循环会放大产出。

Harness 薄弱，循环会放大跑偏。

五、Loop 要落地，先把任务架构设计完整

很多人喜欢从调度脚本开始想 Loop。

这个顺序容易出错。

真正应该先设计的，是任务架构。

仍然以会员积分小程序为例，Loop 开始之前，至少应该先把几类东西准备好。

第一，产品架构。

要明确用户角色、核心流程、端侧划分、页面清单、权限边界和验收路径。用户端、商家端、管理端分别做什么，不做什么，必须写清楚。

第二，模块拆解。

积分账户、积分流水、积分规则、兑换商品、兑换订单、核销、退款回滚、用户等级、活动配置、通知消息、后台权限，每个模块的职责要拆开。

第三，功能拆解。

每个模块下面要有可执行任务，不要只写“完成积分系统”。要写到“实现积分账户表”“实现积分流水写入”“实现兑换订单创建”“实现重复提交防护”“实现后台规则配置校验”这种粒度。

第四，能力流转。

用户完成消费后，积分如何产生；用户兑换权益后，积分如何冻结、扣减、核销、退回；商家修改规则后，什么时候生效；后台发现异常后，如何补偿。这些都属于能力流转。

第五，数据流转。

哪些动作写入账户表，哪些动作写入流水表，哪些动作进入审计表，哪些动作触发通知，哪些动作需要幂等键，哪些动作需要事务或补偿。

第六，验收闭环。

每一轮 Loop 不应该只问“有没有继续写代码”。它应该问：这轮推进了哪个模块？完成了哪个任务？跑了哪些验证？留下了什么证据？下一轮应该接哪里？

这些准备工作完成以后，再让 Agent 生成 Spec、台账、任务顺序和执行规则。

到这一步，Loop 才有意义。

否则定时唤醒 Agent，只是在定时制造不确定性。

六、台账、Spec 和状态文件，是 Loop 的三根绳子

Loop 能否稳定推进，我最看重三类文件：Spec、台账、状态文件。

Spec 负责保住目标。

它要回答项目到底要做什么，目标用户是谁，核心场景是什么，边界是什么，哪些功能属于当前版本，哪些功能不做，验收标准是什么。

如果 Spec 不清楚，Loop 每次启动都可能重新解释目标。

台账负责保住路线。

它要把项目拆成可执行任务，记录任务状态、依赖关系、优先级、完成证据和下一步。台账不是简单 Todo List。它应该能够让 Agent 知道当前推进到哪里，哪些任务已完成，哪些任务被阻塞，哪些任务需要回归验证，哪些任务暂时不碰。

状态文件负责保住现场。

它要记录最近一轮做了什么，改了哪些文件，跑了哪些命令，失败在哪里，下一轮应该先读什么，当前最重要的目标是什么。

如果用更工程化的方式组织，可以把文件设计成这样：

project/  spec.md  architecture.md  module-map.md  ledger.md  current-state.md  next-loop.md  decisions.md  bad-cases.md  validation-log.md

其中 next-loop.md 很关键。

它不需要很长，但必须明确：

• 当前阶段目标；
• 本轮应该做的任务；
• 不应该碰的任务；
• 必须先读的文件；
• 必须执行的验证；
• 完成后必须写回的状态；
• 触发人工接管的条件。

有了这些文件，Loop 每次启动时就不是“你继续帮我做项目吧”。

更好的启动方式是：

请先读取 project/spec.md、project/ledger.md、project/current-state.md 和 project/next-loop.md。本轮只执行 next-loop.md 中标记为 P0 的任务。执行前先复述：1. 当前项目总目标；2. 本轮任务；3. 不应触碰的范围；4. 预期验证命令。执行后必须：1. 更新 ledger.md；2. 更新 current-state.md；3. 写入 validation-log.md；4. 生成下一轮 next-loop.md。如果发现目标、台账、代码状态不一致，停止执行并请求人工确认。

这才是 Loop 的关键。

调度脚本只负责把 Agent 唤醒。真正控制方向的，是这些工程化文件。

七、如何把注意力拉回主线任务目标

Loop 的另一个关键能力，是把 Agent 的注意力不断拉回主线。

这件事不能只靠一句 Prompt。

我建议至少做五层回拉。

第一层，目标回拉。

每轮开始前，Agent 必须复述项目总目标、当前阶段目标和本轮任务。如果复述出来的目标和 Spec 不一致，直接停止。

第二层，范围回拉。

每轮要声明“不做什么”。比如本轮只做积分流水写入，不修改 UI 主题，不重构用户登录，不引入新框架。很多跑偏来自 Agent 顺手优化，范围边界写清楚以后，顺手优化会少很多。

第三层，台账回拉。

每轮执行前后都要对照 ledger.md。执行前读任务依赖，执行后更新状态和证据。没有台账，Loop 很容易变成一次次独立任务，项目主线会断。

第四层，验证回拉。

每轮都要运行与本轮任务对应的验证。验证可以是单测、类型检查、页面截图、端到端流程、SQL 校验、接口调用、人工检查清单。没有验证，状态文件会被“我觉得完成了”污染。

第五层，异常回拉。

当 Agent 连续两轮卡在同一个问题、连续修改同一个文件、连续失败同一个测试、或者改动范围超出本轮任务，就应该触发停止条件。停止不是失败，它是 Harness 保护主线的一部分。

这些机制加起来，Loop 才能从“定时干活”升级成“定时推进”。

干活和推进差别很大。

干活可能只是一直有动作。推进要求每一轮都让项目状态更接近验收。

八、Loop 调度脚本真正应该做什么

调度脚本本身不复杂。

但它不能只做一件事：到点启动 Agent。

更合理的调度脚本，至少应该完成这些动作：

1. 检查项目锁，避免多个 Agent 同时改同一片工作区；
1. 读取 current-state.md，确认上一轮是否正常结束；
1. 检查 next-loop.md，确认本轮任务是否存在；
1. 启动 Agent，并把必须读取的上下文入口传进去；
1. 设置时间上限、Token 预算和最大改动范围；
1. 执行后检查是否更新 ledger、state、validation log；
1. 根据验证结果决定继续、暂停或请求人工确认；
1. 记录本轮摘要，供下一轮和人类复盘。

如果要写得更像工程系统，调度脚本应该围绕四种状态运行：

READYRUNNINGNEEDS_REVIEWBLOCKED

READY 表示可以启动下一轮。

RUNNING 表示当前有 Agent 正在执行。

NEEDS_REVIEW 表示 Agent 已完成一轮，但需要人看证据或合并改动。

BLOCKED 表示发现目标冲突、验证失败、上下文缺失、权限不足或连续失败，需要人工介入。

这个状态机比“每小时跑一次”重要得多。

Loop Engineering 如果只讲调度频率，不讲状态机、验证和接管边界，最后会变成自动化外壳。

九、不要把 Loop 变成概念表演

我不反对新概念。

很多时候，一个好概念可以帮大家重新组织经验，形成更清晰的工程语言。Context Engineering 是这样，Harness Engineering 也是这样。Loop Engineering 这个词也有价值，因为它提醒大家：Agent 不一定要被限制在单次会话里，长期任务可以通过循环调度、状态恢复和验证回写来推进。

但概念必须落回工程。

如果你只是说“我们要做 Loop Engineering”，却没有 Spec、台账、状态文件、验证日志、回滚机制、异常接管和主线回拉，那它只是一层新包装。

我更愿意把 Loop 放进 Harness 工程的完整图景里：

Spec 定目标-> Architecture 定结构-> Module Map 拆模块-> Ledger 管任务-> State 保存现场-> Loop 调度执行-> Validation 验证结果-> Review 处理风险-> Release 沉淀证据

这个链条里，Loop 很重要，但它不是唯一核心。

真正决定长期任务能不能跑下去的，是目标、状态、任务、验证和证据能不能持续闭环。

对 AI Coding 来说，这个判断尤其重要。

未来很多人会让 Agent 在夜里继续写代码，在自己开会时继续修 bug，在周末继续跑重构，在多个项目之间持续推进任务。这个方向肯定会越来越常见。

但无人值守执行的风险也会同步放大。

没有 Harness 的 Loop，会让错误持续发生。

有 Harness 的 Loop，才有机会把时间变成产能。

传统产品经理，正在成为下个被淘汰的“传统岗位”。

过去画原型、写 PRD、跟进度的“传统技能包”，在AI时代正迅速贬值。63% 的企业转型做 AI 产品！当下的问题不再是“要不要学 AI ”，而是“如何构建 AI 产品”。

前段时间还跟字节、腾讯的资深 AI 产品经理沟通，他们反馈：在大量招人，只要有 AI 相关的项目经验，基本都能拿到面试机会，而且领导很舍得给钱，涨薪 40-60% 很正常！

接下来的产品人，得卷AI能力了！

如今AI大火，行业极速发展的背后，懂AI 产品人才却严重稀缺。这不是要你转技术岗，而是要掌握构建 AI 产品的核心方法：

如何将你的领域知识，转化为 AI 产品的核心竞争力？
如何用 AI 技术实现你的产品需求？
如何设计真正懂用户的 AI 交互体验？
……

懂AI，就是产品经理的“救命稻草”！

风口之下，与其焦虑被行业淘汰

不如先人一步享受AI技术带来的红利！

我把AI产品经理的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

（不限年龄！不限岗位！没有代码基础也能学！）

🎁现在扫码，完课还送：

《AI产品面试题库》《AI大模型应用案例集》

掌握技术+实战，快速转型！

想成为一名卓越的AI大模型产品经理，需要从技术、到项目实战的全方位转型指南！

**1）**AI产品应用原理解析，产品经理也能听懂！

对于产品经理来说，如果你不懂技术，做不了业务和AI大模型技术衔接、定义不了数据需求，是没法完整的落地一个产品的！

本次课程，专门面向产品经理人群，解析当下最热门的AI产品应用的必备的「大模型」、「多模态」的实际应用和算法原理！解析AI产品应用技术，积累大模型能力！简单易懂，不需要会代码，小白也能掌握！

大模型微调：掌握主流大模型（如DeepSeek、Qwen等）的微调技术，针对特定场景优化模型性能。学习如何利用领域数据（如制造、医药、金融等）进行模型定制
AI Agent智能体搭建：学习如何设计和开发AI Agent，实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手产品（如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等）

2）超全行业案例解析！

课程详细讲解现阶段，大模型在各个行业和领域的应用现状！包括：零售与电商、教育、医疗、泛娱乐、法律等等10大行业！

详细讲解案例的思路、应用场景，以及背后的技术原理、核心技术！揭秘各个行业、场景的真实现状，和未来产品的发展与机遇！

可以说，讲解完一个案例，就能积累一个AI产品实践的经验！

课程中所涉及到的实战项目，都可以直接在自己的工作中使用，让自己的产品/项目有可借鉴的成功案例！

3）AI产品经理求职专项辅导

课程中会系统的帮助大家拆解字节、腾讯、百度等大厂AI PM岗位JD关键词，掌握AI PM高频面试题型与回答框架；展示 AI 相关能力的关键技巧：Prompt设计、模型评估、A/B测试、成本意识、与算法/工程协作经验；

To B类AI产品经理：突出“行业理解 + 技术落地 + 商业闭环”能力的简历结构设计，展示项目成果；从客户需求洞察到技术方案设计，展现端到产品思维；如何评估To B AI产品的可行性、客户付费意愿与实施成本
To C类AI产品经理：拆解头部公司岗位JD，将过往尽力转化为AI产品叙事逻辑；从行业趋势、产品设计题、案例分析&数据分析题、技术理解边界等全流程辅导面试；避免无效海投、锁定最适合的AI产品岗位；

本次课程，全程直播讲解，能直接对话大佬和专业助教，不懂就问，超详细的案例，小白也能轻松get！

完课后，还赠送《AI产品经理面试题库》、《AI大模型应用案例集》！不断更新中……

适合人群：

想转型AI产品经理、AI项目管理专家、AI产品解决方案等岗位
想进行AI产品创业的创业者
想成为制作AI产品的程序员
想利用AI解决企业问题的管理岗
想在AI方向寻找就业方向的毕业生
AI方向前景广阔、待遇好！

目前，很多产品人已经通过完整学习拿到大厂高薪offer，收入嗷嗷涨！

我把AI产品经理的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

从零构建一个SpringBoot大模型调用应用——复盘

本文介绍了如何通过OpenAI协议调用阿里云千问大模型的实现方法。主要内容包括：1.使用OpenAiService创建客户端，配置baseUrl、apiKey和prefix（兼容OpenAI协议）；2.通过拦截器添加路径前缀实现协议转换；3.利用Retrofit简化网络请求和JSON转换；4.构建ChatCompletionRequest封装模型参数和消息；5.处理单轮对话消息时需用Arrays.

MCP技术社区

企业培养 AI 数字人才，先补齐 5 个生产化控制面

企业培养数字人才不能只停在 Prompt 和工具培训。真正能把 AI Agent 接入生产流程的人，需要同时补齐业务流程、数据证据链、人机协作、运行观测和工程治理 5 个控制面。

MCP技术社区

AnythingLLM：本地部署的全能 AI 应用

AnythingLLM是一款开源的本地AI应用，可将各种大语言模型转变为私有ChatGPT，支持三步快速接入模型、导入文档和对话。它兼容多种主流闭源和开源模型，默认使用LanceDB向量数据库，支持文档自动向量化和语音识别/合成功能。核心功能包括文档对话、AI Agent、动态模型路由、记忆系统和定时任务等，还提供多用户支持和嵌入式聊天组件。技术架构采用monorepo设计，支持Docker一键部