最近AI圈火了一个新概念,名叫Loop Engineering,也就是循环工程。今天就用大白话跟大家聊透它,让你彻底搞懂Loop Engineering到底是什么。

这个新概念的诞生,源自两位行业大佬的观点。

Claude Code负责人Boris Cherny曾说,他现在基本不会专门给Claude写提示词了,日常主要工作就是搭建各类循环,靠这些循环驱动Claude运行,让AI自主判断下一步操作,他的核心工作已经变成了“写循环”。

老规矩,正式开始之前,先抛出几个问题,大家可以先自行思考一下:

1、Loop Engineering到底是什么?它和Prompt Engineering有什么区别?

2、一套完整的Loop,包含哪些核心组成部分?

3、Loop Engineering目前有哪些主流的落地应用场景?

一、为什么会出现 Loop Engineering?

回顾过去两年大家使用AI Agent的方式,流程基本都大同小异。

图片

大家精心打磨一段提示词,把前因后果、上下文需求交代清楚,发送给AI,等AI回复之后,再接着输入新的指令,一来一回推进任务。

说白了,过去的AI Agent只是一个被动工具,全程需要人把控流程、手动推进每一步。

仔细想想就能发现,这个传统用法里,人才是那个一直在循环的主体

但这种模式有很大的弊端,一旦任务变得复杂繁琐,人的打字速度、耐心和专注力,都会成为整个任务推进的最大瓶颈。

而现在大模型的能力越来越强,单次对话的运行时长可以达到几十分钟,甚至数小时,完全具备自主持续运行的能力。

这个时候,再靠人工反复编写、调整提示词,就变得性价比极低。而且很多时候,我们手动写的提示词,本质也是参考大模型的输出整理而来的。

所以行业的核心思路开始转变:与其耗费精力琢磨提示词怎么写更精准,不如直接搭建一套小型自动化系统。让AI自主发现任务、分配任务、自查自检、记录工作成果,并且自主敲定后续的每一步操作。

这就是工程师们对Loop Engineering的核心定义:设定一个终极任务目标,让AI持续递归迭代、自主运转,直到任务彻底完成。

二、一个 Loop 的组成部分

图片

一套能够稳定落地、自主运行的完整Loop,一共包含六大核心模块,缺一不可:

1、任务自动化

这是整个循环的核心核心。系统可以按照设定的时间自动启动,自主检索待执行的任务,全程不需要人工手动触发、手动启动。如果缺少自动化能力,那顶多只能算是单次运行的脚本,根本算不上真正的循环。

2、并行隔离

如果同时启动多个Agent执行任务,很容易出现多个Agent修改同一个文件的情况,引发并发冲突,直接导致任务失败。所以多Agent并行运行时,必须做好任务和文件隔离。

目前最优的解决方式,就是利用Git的worktree功能,为每一个Agent单独分配独立的分支目录,彻底规避互相干扰、互相修改文件的问题。

3、Skills/技能

这里的Skills,就是适配各类任务的流程规范和执行标准,需要我们提前配置设定。

不同类型的任务,对应不同的技能规则,用户可以把各类任务的执行标准、约束要求写入专属文件,让大模型在自主执行任务时,有清晰的决策依据和执行准则。

4、MCP 和插件

这个模块的作用,是打通Loop和各类工具的连接通道。底层可以依托MCP协议,让Agent具备读取工单issue、查询数据库、向各类通讯软件推送消息等能力,让循环系统不再局限于文本对话,能够落地对接各类实际工作场景。

5、子 Agent

核心逻辑是任务拆分、各司其职。把一项复杂任务拆解开来,交给不同的子Agent分别执行。

举个例子,写代码的Agent只负责编码,不要让它同时承担代码检查工作,因为同一模型很容易出现思维惯性,忽略代码漏洞。换成指令不同、模型不同的专属检查Agent,往往能排查出更多隐藏问题。

6、记忆

这是保障循环稳定运行的关键模块。为了留存任务状态、留存关键信息,我们可以把任务记忆整理为markdown文件,持久化存储在本地硬盘。

哪怕后续开启新的对话、重启任务,系统也能调取历史记录,清晰掌握任务背景和过往进度。

三、一个完整 Loop 示例

图片

光讲理论比较抽象,给大家举一个真实可落地的完整案例,一看就懂。

我们可以在代码仓库中设置一个每日定时运行的任务。

系统每天会准时启动,通过预设的Skill规则,自动核查前一天失败的CI任务、未关闭的工单issue以及最新的代码提交记录,并且把所有核查结果整理归档。

针对每一个待处理问题,Loop都会单独创建独立的worktree环境,启动第一个子Agent起草修复方案、完成初步整改,再启动第二个专属子Agent,对照项目规则和现有测试用例,全面核查修复结果。

完成核查后,系统会通过MCP协议自动创建PR、更新工单状态。如果遇到AI无法独立解决的复杂问题,会自动整理成待处理清单,留给人工处理。

整个流程只需要我们提前搭建一次循环体系,后续日常运行全程不需要手写一句提示词,这就是一套成熟、完整的Loop循环工程。

四、常见的 Loop 应用模式

上面的案例是Bug修复类循环,也是最常用的场景。但不同的业务任务,对应的Loop实现逻辑也会不一样,核心区别主要体现在两点:一是依靠什么信号判断任务对错,二是满足什么条件才算任务完成。

这两个核心条件一旦改变,整套循环的运行逻辑就会随之调整。目前行业内已经沉淀出几种成熟、通用的Loop应用模式。

图片

从各类落地场景能看出,设计Loop的核心关键,是看当前任务是否具备大模型可自动识别、可精准判断的明确校验信号

比如测试驱动类任务就非常适配Loop工程,所有测试用例全部通过,就代表任务完成,未通过就是未完成,校验信号清晰明确,AI可以根据测试结果反复迭代修改,自主完成闭环。

编译器驱动类任务也是同理,以类型错误清单清零为核心目标,判断标准一目了然,这类信号明确、标准统一的任务,最容易搭建自动化循环体系。

但如果是产品迭代这类场景,就很难实现完全自动化Loop。比如“页面和设计稿精准对齐”这类需求,没有统一的量化标准,大多只能依靠截图比对,误差和主观性较强。这类循环无法完全脱离人工,关键节点依然需要人工把关审核。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐