循环工程(loop engineering)

1. AI时代应用设计核心范式转变：从确定性到非确定性

62 岁的软件教父 Martin Fowler（马丁・福勒），软件工程领域的泰斗级人物、敏捷宣言联署人、经典著作《重构》的作者、ThoughtWorks 首席科学家。

他在 2025 年关于 "AI 如何重塑软件工程" 中的核心论断：AI 时代软件工程，编程的本质正在从 "确定性逻辑构建" 转向 "不确定性系统设计"。

"这次变革最大的特点，不是抽象层又提高了，而是我们从确定性的世界进入了非确定性的世界"。

传统编程是确定性的（同样输入→同样输出），但大语言模型是非确定性的（同样 Prompt→两次结果可能完全不同）。
"我们需要学会像造桥一样写代码"造桥的结构工程师在工作中有一个核心概念叫容差。木材、钢铁、混凝土的物理性能虽然大致已知，但你不能按照理论最优值去设计，必须留出足够的余量，为最坏的情况做准备。"

这个类比来自他的妻子（一位结构工程师）的工作启发 ------ 土木工程从诞生起就在与不确定性打交道，而软件工程现在才刚刚开始学习这一课。

2. 澳洲放羊大叔的5行代码

2025年底，澳大利亚开发者 $Geoffrey Huntley$ 在"铲羊粪的间隙" 写出了下面这段仅含5行代码的Bash脚本：

bash 复制代码

bash

while :; do 
    cat PROMPT.md | claude-code；
done

这段代码的逻辑简单：

复制代码

启动 → 读取 PROMPT.md → 交给 Claude Code 执行
        ↑                                  │
        │                                  │
        └──── ("做完了" / "出错了") ────────┘

Huntley发现，当AI看到自己上一轮留下的代码、测试结果和错误日志时，它会自动修正，哪怕第一次写错，反复几轮后最终能完成任务。他把这个循环命名为：Ralph Wiggum。Ralph Wiggum是《辛普森一家》中的角色，一个天真的小学生，经常说傻话、做傻事，但异常执着。剧中他有一句经典台词：

"I'm in danger!"

这句台词和"屡败屡战"的精神完美契合Ralph循环 的设计哲学：哪怕在困境中，只要持续迭代、永不放弃，最终就能成功。

3. 智能体管控工程（Harness Engineering）

智能体管控工程（Harness Engineering）是一种基于自动化 、可扩展 和可审计 的智能体构建方法。该方法基于基于真实场景的实证研究 ，通过基于真实场景的测试 和基于真实场景的验证来提高智能体的性能。

3.1. $Langchain 给出的定义$

text 复制代码

Agent = Model + Harness

If you're not the model, you're the harness.
如果你不是模型，你就是管控。

Langchain管控的图表示

智能体管控工程划分为：
- HARNESS（框架/控制层）
  
  位于顶层，代表智能体的"大脑"或运行时的控制器，负责协调所有子模块。
- Context Injection（上下文注入）
  
  包括提示词（prompts）、记忆（memory）、技能（skills）和对话（conversation）。这些是智能体在执行每一步时能获得的"背景信息"和"能力说明"。
- Control（控制逻辑）
  
  包括压缩（compaction，即对上下文的精简）、编排（orchestration）以及"Ralph loops"，让智能体能够反复检查自己的输出、修正错误。
- Model（模型）
  
  模型在这里"reasons → decides"，即根据注入的上下文进行推理并决定下一步行动。
  - 模型有两种输出方式：
    - writes：可能指生成内容、写文件、输出消息
    - reads：可能指读取输入、理解用户请求或环境反馈
- Action（行动）
  
  执行具体的操作，包括调用 bash 命令、使用各种工具（tools）或通过 MCPs（可能是 Model Context Protocol 的缩写，一种标准化的工具调用接口）。执行结果会返回到上下文（results back to context），形成闭环。
- Observer & Verify（观察与验证）
  
  负责获取外部反馈来确认行动是否成功。这包括：浏览器截图、测试结果、日志等。这些信息也会被注入到上下文中，供模型在下一轮决策时使用。
- Persist（持久化）
  
  用于保存状态，保证智能体的工作可以中断后恢复。包括文件系统（filesystem）、Git 版本控制、以及进度文件（progress files），便于跟踪任务的进展。
设计思想 ：

这个架构体现了一种 "感知-推理-行动-验证-持久化" 的循环，是一个高度工程化的 AI Agent 系统。它强调：
- 闭环反馈：行动的结果和观察到的环境变化都会重新进入上下文，影响后续决策。
- 可控性：通过 ralph loops、压缩机制和编排，避免上下文爆炸或无限循环。
- 可扩展性：通过 MCPs、bash、工具等方式，让 Agent 能调用外部能力。
- 可恢复性：通过持久化模块，支持长时间运行的任务。

4. $OpenAI 打造 Codex 管控框架$

OpenAI 的工程文章 $《工程技术：在智能体优先的世界中利用 Codex》$

记录了该领域最具启发性的案例之一。在五个月里，他们的团队没有手工编写了一行应用程序代码。相反，他们构建了基础设施层的架构，让Agent通过它生成超过 100 万行代码。

在项目实践过程中，由于环境规范不明确 ，智能体缺少实现高级目标所必需的工具、抽象层与内部结构，导致开发工作难以推进。此时工程团队的核心任务，转变为辅助智能体高效完成有效工作。

人类的工作模式主要通过提示词与系统交互 ：工程师仅需描述任务、启动智能体，并由智能体自动提交 Pull Request。为推进 PR 合流，工程师会指令 Codex 先在本地审核自身代码变更，再在本地与云端请求其他专用智能体进行审查，并对所有人工或智能体的反馈做出响应，如此循环迭代直至所有智能体审核人员均认可（该过程本质为 Ralph Wiggum 循环）。

Codex 直接复用工程师的标准开发工具（如 gh、本地脚本及代码仓库内置技能）获取上下文信息。在整个流程中，唯一有效的推进方式是由 Codex 执行实际工作 ，而人类工程师则持续介入并追问核心问题：究竟还需要哪些能力，以及如何让这些能力对智能体做到清晰可读、可强制执行？

通过该循环持续优化迭代，最终实现几乎全部审核工作由智能体之间自主完成的目标。

可以将这个过程总结成：

「工程师发起任务 → AI 编码 → PR 推进循环 → 能力迭代升级 → 目标达成」 的完整闭环，是AI 自动化开发 + 人机协同 + 能力持续进化的流程模型。

用人类少量引导，让 AI 智能体实现「编码 - 审核 - 迭代能力」的全自动闭环，最终达成无人工干预的 AI 自动化开发。

在实践过程中，他们将日志、指标和追踪记录构建成一个本地可观测性堆栈，从而使 Codex 能够实时监控和分析自己的运行状态，从而使 Codex 能够快速地响应和修复问题，形成一个闭环反馈机制。

AI编程/代码生成系统构建的可观测性（Observability）栈的设计方案

5. 循环工程（Loop Engineering）

Peter Steinberger（OpenClaw创始人，现已加入OpenAI）6月9日发布的这条X，一天内获得了800万浏览量：

"Stop prompting coding agents. Start designing the loops that prompt them."

「别再给编程 Agent 写提示词了。你应该设计循环，让这些循环去驱动你的 Agent。」

更惊人的是：这不是他一个人的观点------Claude Code 创始人 Boris Cherny 也公开说了完全一样的话：

"我不再给 Claude 写提示词了。是循环在提示 Claude，而我的工作就是写这些循环。"

5.1. 到底什么是循环工程(loop engineering)？

5.1.1. 旧范式（2024-2025）：提示词驱动

复制代码

你写一个好Prompt → Agent执行 → 你检查结果 → 你写下一个Prompt
          ↑___________________________|

人在回路中：每一步都需要人来输入、判断、接力
人的工作：绞尽脑汁写完美的提示词
本质：把 Agent 当一个高级自动补全工具

5.1.2. 新范式（2026）：循环驱动

复制代码

┌─────────────────────────────────────────┐
│           你设计的循环系统               │
│  发现任务 → 分发工作 → 检查结果 → 记录进度 │
└─────────────┬───────────────────────────┘
              │
              ▼
          Agent 执行
              │
              └────────── 回到循环起点

人在回路外：你设计系统，系统驱动Agent
人的工作：架构师------设计闭合的执行循环
本质：Agent 成为系统内的一个执行单元

5.2. 循环工程的5个标准构建块

循环工程需要的组件。Claude Code 和 Codex 在2026年Q2都原生支持了这5个组件。

构建块	Claude Code	Codex	作用
目标条件	`/goal` 指令	Automation 原生	循环运行直到某个条件满足，由独立轻量模型每轮校验结果
技能系统	`SKILL.md`	Skill Plugins	标准化的能力注入，不用每次写在提示词里
Maker-Checker分离	子Agent配置	Triage Inbox	一个Agent写代码，另一个独立Agent做审核
状态持久化	内存脊柱	State File	磁盘上的状态文件，跨会话保留进度（模型会失忆，但仓库不会）
熔断机制	Token 上限	Spend Cap	防止无限循环烧钱的安全闸

5.3. 循环工程中的长任务

复制代码

┌─────────────────────────────────────────────────┐
│               Execution Loop                    │
│    Control → Model → Action → Observe → Control │
└─────────────────────────────────────────────────┘

这就是「循环工程」的可视化表达！

你不再需要反复写："继续做！还没做完！再检查一下！"
你设计一次这个循环，它就会自动、持续、不知疲倦地驱动Agent
不管Agent说"做完了"还是"出错了"，循环都知道下一步该做什么

5.4. ✨ 终极愿景

"设计一次，永不提示"

你设计好一个「晨间分诊→自动分配→自动审核→自动合并PR」的完整循环，然后你去睡觉，第二天早上起来看结果就好了。

这就是为什么 Peter 说：提示词工程师这个职业，正在被循环工程师取代。

6. 总结

范式转变：软件工程从确定性的逻辑构建转向非确定性的系统设计，需要像土木工程一样预留"容差"。
Ralph 循环 ：通过 while :; do cat PROMPT.md | claude-code; done 这样的简单循环，让 Agent 基于上一轮的输出、日志和错误自动修正，体现"屡败屡战"的迭代哲学。
智能体管控工程（Harness Engineering） ：LangChain 定义 Agent = Model + Harness，管控层包含上下文注入、控制逻辑（含 Ralph 循环）、行动、观测与验证、持久化等模块，形成"感知-推理-行动-验证-持久化"闭环。
OpenAI Codex 实践：五个月内不写一行应用代码，而是构建基础设施层，让 Agent 自动编码、审核、迭代，最终实现智能体之间自主完成大部分审核工作；核心是人类追问"Agent 还需要什么能力，以及如何让这些能力清晰可读、可强制执行"。
循环工程（Loop Engineering） ：2026 年提出的新范式，人不再在回路中写提示词，而是设计驱动 Agent 的循环系统。标准构建块包括：目标条件（/goal）、技能系统（SKILL.md）、Maker-Checker 分离、状态持久化（内存脊柱/状态文件）、熔断机制（Token 上限/消费上限）。
长任务可视化 ：循环结构 Control → Model → Action → Observe → Control 自动、持续驱动 Agent，无论"做完了"还是"出错了"都能继续。
终极愿景："设计一次，永不提示"------提示词工程师被循环工程师取代。
循环工程面对的挑战：
- 成本爆炸风险：循环驱动 Agent 可能无意义地反复尝试失败路径，即使有熔断机制，也可能在触发熔断前已消耗大量资源。
- 目标漂移（Goal Drift）：长时间循环中，Agent 可能偏离最初目标，文章未提出任何应对策略（如定期重述目标、沙箱隔离等）。
- 可解释性下降：人不在回路中，中间决策过程更难审计，对关键系统（如金融、医疗）的风险较大。

循环工程(loop engineering)

1. AI时代应用设计核心范式转变：从确定性到非确定性

2. 澳洲放羊大叔的5行代码

3. 智能体管控工程（Harness Engineering）

3.1. Langchain 给出的定义

4. OpenAI 打造 Codex 管控框架

5. 循环工程（Loop Engineering）

5.1. 到底什么是循环工程(loop engineering)？

5.1.1. 旧范式（2024-2025）：提示词驱动

5.1.2. 新范式（2026）：循环驱动

5.2. 循环工程的5个标准构建块

5.3. 循环工程中的长任务

5.4. ✨ 终极愿景

6. 总结

3.1. $Langchain 给出的定义$

4. $OpenAI 打造 Codex 管控框架$