循环工程(loop engineering)

1. AI时代应用设计核心范式转变:从确定性到非确定性

62 岁的软件教父 Martin Fowler(马丁・福勒),软件工程领域的泰斗级人物、敏捷宣言联署人、经典著作《重构》的作者、ThoughtWorks 首席科学家。

他在 2025 年关于 "AI 如何重塑软件工程" 中的核心论断:AI 时代软件工程,编程的本质正在从 "确定性逻辑构建" 转向 "不确定性系统设计"

"这次变革最大的特点,不是抽象层又提高了,而是我们从确定性的世界进入了非确定性的世界"。

传统编程是确定性的(同样输入→同样输出),但大语言模型是非确定性的(同样 Prompt→两次结果可能完全不同)。
"我们需要学会像造桥一样写代码"造桥的结构工程师在工作中有一个核心概念叫容差。木材、钢铁、混凝土的物理性能虽然大致已知,但你不能按照理论最优值去设计,必须留出足够的余量,为最坏的情况做准备。"

这个类比来自他的妻子(一位结构工程师)的工作启发 ------ 土木工程从诞生起就在与不确定性打交道,而软件工程现在才刚刚开始学习这一课。

2. 澳洲放羊大叔的5行代码

2025年底,澳大利亚开发者Geoffrey Huntley在"铲羊粪的间隙" 写出了下面这段仅含5行代码的Bash脚本:

bash 复制代码
bash

while :; do 
    cat PROMPT.md | claude-code;
done

这段代码的逻辑简单:

复制代码
启动 → 读取 PROMPT.md → 交给 Claude Code 执行
        ↑                                  │
        │                                  │
        └──── ("做完了" / "出错了") ────────┘

Huntley发现,当AI看到自己上一轮留下的代码、测试结果和错误日志时,它会自动修正,哪怕第一次写错,反复几轮后最终能完成任务。他把这个循环命名为:Ralph Wiggum。Ralph Wiggum是《辛普森一家》中的角色,一个天真的小学生,经常说傻话、做傻事,但异常执着。剧中他有一句经典台词:

"I'm in danger!"

这句台词和"屡败屡战"的精神完美契合Ralph循环 的设计哲学:哪怕在困境中,只要持续迭代、永不放弃,最终就能成功


3. 智能体管控工程(Harness Engineering)

智能体管控工程(Harness Engineering)是一种基于自动化可扩展可审计 的智能体构建方法。该方法基于基于真实场景的实证研究 ,通过基于真实场景的测试基于真实场景的验证来提高智能体的性能。

3.1. Langchain 给出的定义

text 复制代码
Agent = Model + Harness

If you're not the model, you're the harness.
如果你不是模型,你就是管控。
  • Langchain管控的图表示
  • 智能体管控工程划分为

    • HARNESS(框架/控制层)

      位于顶层,代表智能体的"大脑"或运行时的控制器,负责协调所有子模块。

    • Context Injection(上下文注入)

      包括提示词(prompts)、记忆(memory)、技能(skills)和对话(conversation)。这些是智能体在执行每一步时能获得的"背景信息"和"能力说明"。

    • Control(控制逻辑)

      包括压缩(compaction,即对上下文的精简)、编排(orchestration)以及"Ralph loops",让智能体能够反复检查自己的输出、修正错误。

    • Model(模型)

      模型在这里"reasons → decides",即根据注入的上下文进行推理并决定下一步行动。

      • 模型有两种输出方式:
        • writes:可能指生成内容、写文件、输出消息
        • reads:可能指读取输入、理解用户请求或环境反馈
    • Action(行动)

      执行具体的操作,包括调用 bash 命令、使用各种工具(tools)或通过 MCPs(可能是 Model Context Protocol 的缩写,一种标准化的工具调用接口)。执行结果会返回到上下文(results back to context),形成闭环。

    • Observer & Verify(观察与验证)

      负责获取外部反馈来确认行动是否成功。这包括:浏览器截图、测试结果、日志等。 这些信息也会被注入到上下文中,供模型在下一轮决策时使用。

    • Persist(持久化)

      用于保存状态,保证智能体的工作可以中断后恢复。包括文件系统(filesystem)、Git 版本控制、以及进度文件(progress files),便于跟踪任务的进展。

  • 设计思想

    这个架构体现了一种 "感知-推理-行动-验证-持久化" 的循环,是一个高度工程化的 AI Agent 系统。它强调:

    • 闭环反馈:行动的结果和观察到的环境变化都会重新进入上下文,影响后续决策。
    • 可控性:通过 ralph loops、压缩机制和编排,避免上下文爆炸或无限循环。
    • 可扩展性:通过 MCPs、bash、工具等方式,让 Agent 能调用外部能力。
    • 可恢复性:通过持久化模块,支持长时间运行的任务。

4. OpenAI 打造 Codex 管控框架

OpenAI 的工程文章《工程技术:在智能体优先的世界中利用 Codex》

记录了该领域最具启发性的案例之一。在五个月里,他们的团队没有手工编写了一行应用程序代码。相反,他们构建了基础设施层的架构,让Agent通过它生成超过 100 万行代码。

在项目实践过程中,由于环境规范不明确 ,智能体缺少实现高级目标所必需的工具、抽象层与内部结构,导致开发工作难以推进。此时工程团队的核心任务,转变为辅助智能体高效完成有效工作

人类的工作模式主要通过提示词与系统交互 :工程师仅需描述任务、启动智能体,并由智能体自动提交 Pull Request。为推进 PR 合流,工程师会指令 Codex 先在本地审核自身代码变更,再在本地与云端请求其他专用智能体进行审查,并对所有人工或智能体的反馈做出响应,如此循环迭代直至所有智能体审核人员均认可(该过程本质为 Ralph Wiggum 循环)。

Codex 直接复用工程师的标准开发工具(如 gh、本地脚本及代码仓库内置技能)获取上下文信息。在整个流程中,唯一有效的推进方式是由 Codex 执行实际工作 ,而人类工程师则持续介入并追问核心问题:究竟还需要哪些能力,以及如何让这些能力对智能体做到清晰可读、可强制执行?

通过该循环持续优化迭代,最终实现几乎全部审核工作由智能体之间自主完成的目标。

可以将这个过程总结成:

「工程师发起任务 → AI 编码 → PR 推进循环 → 能力迭代升级 → 目标达成」 的完整闭环,是AI 自动化开发 + 人机协同 + 能力持续进化的流程模型。

用人类少量引导,让 AI 智能体实现「编码 - 审核 - 迭代能力」的全自动闭环,最终达成无人工干预的 AI 自动化开发。

在实践过程中,他们将日志、指标和追踪记录构建成一个本地可观测性堆栈,从而使 Codex 能够实时监控和分析自己的运行状态,从而使 Codex 能够快速地响应和修复问题,形成一个闭环反馈机制。

  • AI编程/代码生成系统构建的可观测性(Observability)栈的设计方案

5. 循环工程(Loop Engineering)

Peter Steinberger(OpenClaw创始人,现已加入OpenAI)6月9日发布的这条X,一天内获得了800万浏览量:

"Stop prompting coding agents. Start designing the loops that prompt them."

「别再给编程 Agent 写提示词了。你应该设计循环,让这些循环去驱动你的 Agent。」

更惊人的是:这不是他一个人的观点------Claude Code 创始人 Boris Cherny 也公开说了完全一样的话:

"我不再给 Claude 写提示词了。是循环在提示 Claude,而我的工作就是写这些循环。"

5.1. 到底什么是循环工程(loop engineering)?

5.1.1. 旧范式(2024-2025):提示词驱动

复制代码
你写一个好Prompt → Agent执行 → 你检查结果 → 你写下一个Prompt
          ↑___________________________|
  • 人在回路中:每一步都需要人来输入、判断、接力
  • 人的工作:绞尽脑汁写完美的提示词
  • 本质:把 Agent 当一个高级自动补全工具

5.1.2. 新范式(2026):循环驱动

复制代码
┌─────────────────────────────────────────┐
│           你设计的循环系统               │
│  发现任务 → 分发工作 → 检查结果 → 记录进度 │
└─────────────┬───────────────────────────┘
              │
              ▼
          Agent 执行
              │
              └────────── 回到循环起点
  • 人在回路外:你设计系统,系统驱动Agent
  • 人的工作:架构师------设计闭合的执行循环
  • 本质:Agent 成为系统内的一个执行单元

5.2. 循环工程的5个标准构建块

循环工程需要的组件。Claude Code 和 Codex 在2026年Q2都原生支持了这5个组件。

构建块 Claude Code Codex 作用
目标条件 /goal 指令 Automation 原生 循环运行直到某个条件满足,由独立轻量模型每轮校验结果
技能系统 SKILL.md Skill Plugins 标准化的能力注入,不用每次写在提示词里
Maker-Checker分离 子Agent配置 Triage Inbox 一个Agent写代码,另一个独立Agent做审核
状态持久化 内存脊柱 State File 磁盘上的状态文件,跨会话保留进度(模型会失忆,但仓库不会)
熔断机制 Token 上限 Spend Cap 防止无限循环烧钱的安全闸

5.3. 循环工程中的长任务

复制代码
┌─────────────────────────────────────────────────┐
│               Execution Loop                    │
│    Control → Model → Action → Observe → Control │
└─────────────────────────────────────────────────┘

这就是「循环工程」的可视化表达!

  • 你不再需要反复写:"继续做!还没做完!再检查一下!"
  • 你设计一次这个循环,它就会自动、持续、不知疲倦地驱动Agent
  • 不管Agent说"做完了"还是"出错了",循环都知道下一步该做什么

5.4. ✨ 终极愿景

"设计一次,永不提示"

你设计好一个「晨间分诊→自动分配→自动审核→自动合并PR」的完整循环,然后你去睡觉,第二天早上起来看结果就好了。

这就是为什么 Peter 说:提示词工程师这个职业,正在被循环工程师取代。

6. 总结

  1. 范式转变:软件工程从确定性的逻辑构建转向非确定性的系统设计,需要像土木工程一样预留"容差"。
  2. Ralph 循环 :通过 while :; do cat PROMPT.md | claude-code; done 这样的简单循环,让 Agent 基于上一轮的输出、日志和错误自动修正,体现"屡败屡战"的迭代哲学。
  3. 智能体管控工程(Harness Engineering) :LangChain 定义 Agent = Model + Harness,管控层包含上下文注入、控制逻辑(含 Ralph 循环)、行动、观测与验证、持久化等模块,形成"感知-推理-行动-验证-持久化"闭环。
  4. OpenAI Codex 实践:五个月内不写一行应用代码,而是构建基础设施层,让 Agent 自动编码、审核、迭代,最终实现智能体之间自主完成大部分审核工作;核心是人类追问"Agent 还需要什么能力,以及如何让这些能力清晰可读、可强制执行"。
  5. 循环工程(Loop Engineering) :2026 年提出的新范式,人不再在回路中写提示词,而是设计驱动 Agent 的循环系统。标准构建块包括:目标条件(/goal)、技能系统(SKILL.md)、Maker-Checker 分离、状态持久化(内存脊柱/状态文件)、熔断机制(Token 上限/消费上限)。
  6. 长任务可视化 :循环结构 Control → Model → Action → Observe → Control 自动、持续驱动 Agent,无论"做完了"还是"出错了"都能继续。
  7. 终极愿景:"设计一次,永不提示"------提示词工程师被循环工程师取代。
  8. 循环工程面对的挑战:
    • 成本爆炸风险:循环驱动 Agent 可能无意义地反复尝试失败路径,即使有熔断机制,也可能在触发熔断前已消耗大量资源。
    • 目标漂移(Goal Drift):长时间循环中,Agent 可能偏离最初目标,文章未提出任何应对策略(如定期重述目标、沙箱隔离等)。
    • 可解释性下降:人不在回路中,中间决策过程更难审计,对关键系统(如金融、医疗)的风险较大。
相关推荐
跨境数据猎手1 小时前
淘宝大数据技术在电商行业的应用
大数据
阿部多瑞 ABU2 小时前
铁三角:泛二次元奶头乐经济的结构分析及其人口后果
大数据·人工智能
吴卫斌2 小时前
波动率控制仓位系列(一):满仓轮动的“过山车”困境
大数据·python·股票·量化交易
AI焦点2 小时前
2026年AI应用架构:如何避坑并选对API聚合中转服务?
大数据·人工智能·架构
精益数智小屋2 小时前
项目管理看板如何拆解任务进度?项目管理看板解决跨部门协作难题
大数据·人工智能·数据分析·云计算·软件工程
xcbrand2 小时前
湖南VI设计公司排名
大数据·人工智能·python
Jiamiren2 小时前
2026美国至6月6日当周初请失业金人数(万人)
大数据
清辞8532 小时前
产品经理需求推进流程
大数据·深度学习·学习·产品经理
极创信息4 小时前
Linux挖矿病毒深度清理实战教程,从进程隐藏、Rootkit驻留到彻底根除
java·大数据·linux·运维·安全·tomcat·健康医疗