Loop Engineering 实战:/goal 命令让 AI 自己写完整项目
导读:适合正在用或想尝试 Claude Code 的程序员。读完你会知道 Loop Engineering 到底是什么、/goal 和 /loop 怎么用、怎么把普通提示词改造成自动循环,以及踩坑避雷经验。
AI 编程圈又出新概念了------这次叫 Loop Engineering 循环工程。
起因是 Claude Code 之父 Boris Cherny 在最新访谈里说了一段话:
我不再提示 Claude 了。我有一堆循环在运行,它们才是在提示 Claude 并判断接下来该做什么。我的工作变成了写循环。

Boris Cherny 预测,编程史的下一次跃迁,Loop 时代来了!
紧接着 OpenAI 的 Peter Steinberger(OpenClaw 之父) 也公开表示:你不该再给编程 Agent 写提示词了,应该设计一套循环机制,让这些循环去提示你的 Agent。
两家顶级 AI 公司的核心人物,同时在说一件事:AI 编程的范式要升级了,从手动写提示词,变成设计循环系统。

说实话,我第一反应也是「又来?Harness Engineering 还没学完呢」。但上周三晚上,我在 Claude Code 里敲了一行 /goal 命令然后去洗澡,回来发现 AI 已经自己建好了项目结构、写完了数据库 Schema、搭了 4 个页面,还自己跑通了构建验证。整个过程我一个字没打。
体验完之后我不得不说:这玩意儿是真的有用。
这篇文章我就把 Loop Engineering 从头给你讲明白------它是什么、跟之前那堆 Engineering 有什么关系、Claude Code 里怎么用、怎么把你现在的提示词升级成 Loop。跟着敲一遍就能上手。
一、Loop Engineering 到底是什么
Loop Engineering(循环工程):一种 AI 编程范式,你设计一套自动运转的循环系统,代替你去给 AI 下达指令、检查输出、记录进度、决定下一步做什么,不断循环直到达成目标。你可以理解为「给 AI 装上自动驾驶系统」。
第一次听可能有点抽象,拿开车打比方就清楚了。
Loop Engineering 像一个自动导航系统。以前你得盯着地图,在每个路口告诉 AI「前面左转」「下一个出口下高速」。现在你只需要输入目的地,导航自己规划路线------堵车了自己绕、走错了自动重新算路、到了目的地语音提醒你。你手不用离开方向盘,但脑子已经不用一直想着怎么走了。
你从「一步一步指挥 AI」的操作者,变成了「定方向 + 最后验收」的监督者。

上图就是 Loop 的基本骨架。不是让 AI 随便跑,而是一个严格的「执行 → 验证 → 反馈 → 决策」闭环。
Loop 的 3 个核心要素
一个真正能用的 Loop,需要三样东西:
1)可验证的停止条件
你得告诉 Loop 什么时候算完成,而且这个标准必须能被自动验证。比如「npm run build 通过」「所有测试绿了」「lint 零报错」------这些都是好条件。而「把代码优化一下」就不行,没人知道什么叫优化好了。
2)反馈闭环
每轮循环结束后,Loop 得自己检查这轮结果,判断继续跑还是停下。最常见的形式:写完代码自动跑测试,没过就自己修,修完再跑,通了才停。
3)状态记忆
AI 的对话窗口有长度限制,关了就没。Loop 需要一个外部文件(比如 PROGRESS.md)记录当前进度------哪些做完了、哪些还在做、上一轮出了什么错。中间断了重启,不会从零开始。

两张图一对比就很清楚。传统模式是「人 → AI → 人等 AI → 人再推」,Loop 是「人定目标 → AI 自己跑 → 人验收」。
可能有人会问:Loop 不就是个 while 循环吗?写个脚本让 AI 反复执行不就行了?
不是。没有判断能力的循环,AI 可能把错误当正确答案继续跑,越跑越偏。Loop Engineering 和 cron 定时脚本的本质区别,就在于那个反馈闭环------它能自己判断这轮做得好不好,不好就换策略,不是无脑重试。
二、AI 编程是怎么一步步走到 Loop 的
Loop 不是突然冒出来的,它是从前几代方法论一层层长出来的。了解这条进化线,你才知道 Loop 到底解决了什么问题、为什么现在才出现。
1、提示词工程 Prompt Engineering(2022~2024)
核心问题是 AI 经常答非所问。解法是研究怎么通过对话让 AI 听懂你------设定角色、约束输出格式、用思维链让它逐步推理。这个阶段你大部分精力花在打磨那几段提示词上。
2、上下文工程 Context Engineering(2025)
提示词写好了,但 AI 不了解你的项目,给的回答常常脱离实际。上下文工程解决的就是这个------在对的时候把对的信息喂给 AI。比如写 CLAUDE.md 规则文件、用 RAG 检索项目文档、建立跨会话记忆。AI 的输出开始贴合你的实际场景了。
3、驾驭工程 Harness Engineering(2026 年初)
AI 能理解项目了,但产出不稳定------有时候写得好,有时候跑偏。Harness 的思路是给 AI 搭一整套靠谱的工作环境:配好工具链、写好测试、定好架构约束、拆好任务。相当于你给 AI 修了一条跑道,它在这条跑道上不容易翻车。
4、循环工程 Loop Engineering(2026 年中)
前面三步都做好了,AI 已经能在靠谱的环境里干活了。但你还是得一步步推着它走------写完这一步,你看了觉得 OK,再告诉它下一步干什么。Loop 解决的就是这个------把「提示、检查、决定下一步」交给一套自动循环系统,你只设定目标和停止条件,然后等着验收。
这四层不是替代关系,是层层叠加的。提示词技巧、上下文管理、Harness 搭建,在 Loop 里全都要用。Loop 只是在最上面多了一层「自动循环 + 反馈闭环」。
很多人搞不清 Harness 和 Loop 的区别,我拿工厂流水线打个比方。
Harness 相当于你建了一条生产线,每个工位配好了工具和质检标准,然后你站在产线旁边盯着------哪个环节卡住了你过去疏通,哪个零件不合格你挑出来。产线跑起来了,但离不开你的实时指挥。
Loop 是你把整条产线的流程写成程序,设定好质检规则和异常处理逻辑,按下启动键就走了。机器自己投料、加工、质检,不合格的自动回炉重做,产线卡住了自动报警。你从产线管理员变成了工厂设计师。
| 阶段 | 核心问题 | 你做什么 | 典型手段 |
|---|---|---|---|
| Prompt Engineering | AI 答非所问 | 写更好的提示词 | 角色设定、思维链 |
| Context Engineering | 回答脱离实际 | 喂项目背景 | CLAUDE.md、RAG |
| Harness Engineering | 产出不稳定 | 搭工作环境 | 工具链、测试、规范 |
| Loop Engineering | 需要人推着走 | 设计自动循环 | /goal、/loop、PROGRESS.md |
三、Claude Code 里的两种循环
(2026 年 6 月实测,/goal 需要 Claude Code v2.1.139 或更高版本,/loop 适用于 v2.0+)
Claude Code 目前内置了两个 Loop 命令,分别对应不同场景。第一次用容易搞混,这里说清楚。
/goal ------ 跑到完成为止
/goal 的机制:你给出一个目标 + 可验证的完成条件,AI 开始工作。每一轮结束后,有一个独立的判断模型来检查「目标达成了没」。没达成就自动下一轮,达成就停止并报告。
注意,判断目标的和执行任务的是两个模型,避免了自己改自己卷子的偏差。
bash
/goal 从零搭建 AI 开发日志项目,包含前端页面和 SQLite 数据库,直到 npm run build 通过且 dev server 能正常访问所有页面
加熔断限制防止跑飞:
bash
/goal 修复项目里所有 TypeScript 类型错误,直到 tsc --noEmit 零报错。最多跑 20 轮,超了自动停止
/loop ------ 定时反复跑
/loop 按固定时间间隔执行操作:
bash
/loop 5m 检查项目前后端的部署状态,如果有报错就通知我

| 维度 | /goal | /loop |
|---|---|---|
| 运行方式 | 跑到目标达成为止 | 按固定时间间隔重复 |
| 适合场景 | 有明确终点的一次性任务 | 没有明确终点的持续监控 |
| 验证机制 | 独立判断模型检查目标 | 每轮执行后等下一轮触发 |
| 停止方式 | 目标达成 / 熔断触发 | 手动停止 |
| 典型用例 | 从零搭项目、批量重构 | 等部署、监控报错、定时扫描 |
四、实战:用 /goal 从零搭建「AI 开发日志」项目
概念和命令讲完了,直接上手。
项目是什么
做一个叫「AI 开发日志」的全栈小项目,功能很简单:
- 记录每次 AI 编程会话的内容、Token 消耗、产出代码量
- 仪表盘页面展示本周统计
- 历史记录列表,支持搜索和筛选
技术栈:Next.js 14 + SQLite(better-sqlite3)+ Tailwind CSS。
设定目标
在 Claude Code 工作目录下输入:
bash
/goal 从零搭建"AI 开发日志"全栈项目。
技术栈:Next.js 14 (App Router) + TypeScript + Tailwind CSS + better-sqlite3。
功能要求:
1. 首页:仪表盘,展示本周 AI 会话次数、总 Token 消耗、代码产出量
2. 历史页:所有会话记录列表,支持按日期搜索和按项目筛选
3. 新增页:表单,填写会话内容、Token 数、代码行数、项目名
4. API 路由:/api/sessions 支持 GET 和 POST
停止条件:npm run build 无报错,npm run dev 能正常启动,浏览器访问首页、历史页、新增页均能正常渲染。
每完成一个模块就跑一次构建验证,有报错自己修,修完再继续。同一问题修复超过 5 次就记录到 PROGRESS.md 跳过。
完成后输出 Token 总消耗和项目文件清单。
回车,AI 就自己开始干了。

AI 自己的开发节奏
整个过程我没有干预,AI 按这样的节奏跑:
npx create-next-app初始化项目,安装依赖- 创建 SQLite 数据库和 API 路由
- 写仪表盘页面,跑
npm run build------报错,自己修 - 写历史列表页,跑构建------通过
- 写新增表单页,跑构建------又报错,修了 2 轮通过
- 最终全量验证
npm run build && npm run dev
AI 自己维护了一个 PROGRESS.md,记录每轮做了什么、碰到什么问题、怎么修的。这就是前面说的状态记忆。
验收
大概跑了 11 分钟,AI 建了 12 个文件,碰到 3 次构建报错全自己修了,最后 npm run build 一次通过。http://localhost:3000 三个页面正常渲染,CRUD 功能跑通。


可能有人会问:这不就是让 AI 一把梭吗?跟我直接说"帮我写个项目"有区别吗?
区别大了。直接说「帮我写个项目」,AI 一次性输出所有代码,你复制进去大概率跑不通------AI 不知道你的 Node 版本、依赖冲突、文件路径。而 /goal 是逐轮执行、每轮验证的,写一个模块就跑一次构建,报错了当场修。反馈闭环的价值就在这------不是最后才检查,是每一步都在检查。
五、实战:用 /loop 做定时任务
如果 /goal 是让 AI 替你干活,/loop 就是让 AI 替你盯着。
举个我实际在用的场景:有个小项目的服务偶尔会挂,时间不固定。以前每隔一会就手动 curl 一下,烦得很。现在:
bash
/loop 10m 检查 http://localhost:3001/api/health 是否返回 200。连续 2 次返回非 200,给我桌面通知。每次检查结果记录到 health-check.log
AI 每 10 分钟盯一次,挂了就通知,我该干嘛干嘛。
更多实用场景:
/loop 30m 扫描代码库,检查是否有新的安全漏洞上报/loop 1h 检查 GitHub Issues 有没有新带 bug 标签的 issue,有就汇总通知/loop 5m 检查 CI/CD 构建状态,构建完成就通知
记住:/loop 会一直跑,任务达成就停掉。
六、把普通提示词改造成 Loop 的三步法
你可能会想:我用的是 Cursor 或者 Codex,没有 /goal 命令怎么办?
Loop Engineering 的核心不是某个命令,是一套方法论。在任何工具里,只要在提示词里嵌入循环机制,一样能跑出 Loop 效果。

第一步:模糊需求改成可验证的停止条件
改前:
帮我写一个博客项目。
改后:
从零搭建博客项目,直到 npm run build 通过,且浏览器能正常访问首页、文章详情页、管理后台。
有了明确的可验证条件,AI 才知道什么时候算做完了。
第二步:加状态追踪文件
markdown
在项目根目录维护 PROGRESS.md,记录当前阶段、已完成事项、进行中事项、遇到的问题和解决方案。每完成一个模块更新一次。
这样 AI 不会忘了自己做过什么,你也能随时看进度。
第三步:加反馈闭环
markdown
每完成一个功能模块,立即运行编译或测试验证。有报错就先修复再推进。同一问题修复超过 5 次仍未解决,记录到 PROGRESS.md 后跳过,继续推进其他任务。
这就是开发-验证闭环加防死循环熔断。
完整模板
以上三步整合起来,直接套用:
markdown
## 任务目标
{你的项目描述,尽量具体}
## 停止条件
{1~3 个可自动验证的条件,如:npm run build 通过、所有测试绿、lint 零报错}
## 自主开发循环
1. 状态追踪:项目根目录维护 PROGRESS.md,记录当前阶段、已完成事项、进行中事项。每完成一个模块更新一次
2. 开发-验证闭环:每完成一个模块,立即编译或运行验证。有报错就修复,通过后才推进
3. 防死循环:同一问题修复超过 5 次仍未解决,记录到 PROGRESS.md 后跳过,继续推进
4. 最终验证:全部完成后做一次端到端验证
全程自主开发,不要停下来等我确认,除非遇到无法自行解决的阻塞问题。
在 Cursor 或 Codex 里用这个模板,效果跟 /goal 很接近。
为什么需要防死循环
Loop 跑久了最常见的翻车就是陷入死循环------AI 反复修同一问题修不好,或者修好了又引入新问题。所以我建议三个熔断条件都配上:
- 同一问题重试上限(建议 5 次)

- 单轮 Token 预算(比如 200K tokens)
- 进度停滞检测(连续 3 轮 PROGRESS.md 无变化说明 AI 卡住了)
七、踩坑与省钱指南
Loop 用起来爽,坑也不少。下面是我亲自踩过的几个。
Token 不是烧的,是放烟花
第一次用 /goal 没设熔断,目标写了个「重构整个项目」。AI 跑了 50 分钟,花了快 80 万 Token,效果还不如我自己花 2 小时重写。
Loop 是个杠杆------能撬动你的工程能力,也能撬翻你的项目。
启动前先想三件事:目标能不能量化?做完值不值这个 Token 钱?跑崩了有没有 Plan B?一个 /goal 省 2 小时手工操作,花 5 块钱 Token,值。跑了 50 块还搞砸了要返工,纯浪费。
Overbaking:AI 开始自己加戏
这是我碰到的最有意思的坑。有一次让 AI 搭一个 CRUD 后台,目标写太松------「做一个功能完善的管理系统」。跑了 20 分钟,AI 开始给项目加用户权限系统、操作日志、甚至还有个「暗黑模式切换」。
这些功能我一个没要,但 AI 觉得「功能完善」就该有这些。
这个现象社区叫 Overbaking 过度烘焙------Loop 跑太久、目标约束太松,AI 开始给自己加需求。最早在 Ralph Wiggum Loop 的实践中就被发现了,有人用它让 AI 在循环里不断重构代码,跑太久之后 AI 开始乱加功能、乱删测试。
解决:目标写清楚做什么和不做什么,设轮次上限,跑完人工审查再合并。
调试比提示词难十倍
Loop 跑了 47 轮后出问题,很难定位是第几轮埋的坑。建议:从小目标开始,每轮让 AI 写清楚做了什么、结果如何,PROGRESS.md 就是你的调试日志。
学习路径
刚开始用 AI 编程、还在 Vibe Coding 阶段的话,先别急学 Loop。把提示词技巧练好,学会用 CLAUDE.md 给 AI 项目上下文。等你到了「AI 能写出我想要的代码,但每次都得我一步步推」这个阶段,Loop 该上场了。
从 /goal 开始就够,给 AI 一个小目标让它跑一轮,感受下节奏和 Token 消耗。顺手之后再加定时循环、熔断机制这些进阶玩法。
最后
Loop Engineering 不是什么魔法,就是把「你推着 AI 走」换成了「你定规则,AI 自己走」。
从提示词工程到上下文工程,再到 Harness 和 Loop,AI 编程的自动化程度越来越高。但工具越强,你作为决策者的角色越重要------Loop 设计得好不好、目标拆得清不清楚、反馈机制靠不靠谱,全看你的工程判断力。
Loop 像一台大功率音响------你给它放什么歌,它就放大什么。放好歌,整个场子都炸了。放噪音,全场捂着耳朵跑。
用它来加速你真正理解的工作,别让它替你思考本该自己搞懂的问题。