从 Prompt Engineering 到 Loop Engineering:AI 工程范式的演进

一、演进脉络

过去三年,AI 应用工程化经历了 四个关键阶段,每一次都是抽象层级的跃迁:

阶段 时间 核心关注 人的角色
Prompt Engineering 2023 怎么写好单次提示词,诱导模型输出 "问话者"------雕琢咒语
Context Engineering 2025 上 管理上下文窗口------塞什么、不塞什么、顺序如何 "信息架构师"------设计信息边界
Harness Engineering 2025 下--2026 初 给 Agent 加约束框架------工具权限、反馈循环、护栏 "驯兽师"------设安全护栏
Loop Engineering 2026 中 设计循环系统让 Agent 自己提示 Agent,不再手动发指令 "系统建筑师"------设计运转规则

这四者不是替代关系,而是 叠加包含。新范式解决旧范式无法处理的问题,实践中往往共存。


二、Loop Engineering 是什么

2026 年 6 月,两位关键人物几乎同时发声:

  • Boris Cherny(Anthropic 工程师,Claude Code 创建者):

    "我不再提示 Claude 了。我在写一堆循环(loops),它们才是在提示 Claude 并决定下一步做什么。"

  • Peter Steinberger(OpenAI,原 Lobster/OpenClaw 创始人):

    "你不该再给编程 Agent 写提示词了。你应该设计循环机制,让循环去提示你的 Agent。"

Steinberger 的推文引发了 800万+ 次浏览,全网热议。

核心转变

从"人提示 AI" → "人设计系统,系统提示 AI"

开发者不再手动向 Agent 输入指令,而是设计一个 持续运转的循环系统,由系统自动调度、提示、验证 Agent。


三、Agent Loop 的工作原理

一个典型的 Agent Loop 流程:

目标 → 行动 → 观察 → 评估 → 修正 → 下一轮行动

对比维度 传统编程循环(for/while) AI Agent Loop
执行对象 固定的指令序列 目标(Goal)
每一步 相同逻辑代码重复 行动→观察→评估→修正
处理不确定性 需提前覆盖所有 if/else Agent 自主调整路径
结束条件 计数器或固定条件 目标达成/失败/资源耗尽/人工介入

四、关键里程碑

1. Ralph(2025.7)------第一个典型 Agent Loop

  • 澳大利亚开发者 Geoffrey Huntley 发布
  • 本质是个 Bash 脚本:反复将同一个提示词文件喂给 Agent
  • 关键创新:每次迭代重置上下文到固定锚点文件,解决上下文污染
  • 用此方法构建了一门完整编程语言,仅花 ~297 美元
  • 证明了 Loop 的核心价值:让 Agent 在持续改进环境中试错迭代

2. /goal 命令产品化(2026 春)

  • Codex (OpenAI)和 Claude Code (Anthropic)都推出了 /goal
  • 持续运行循环直到某个验证条件完成
  • 将 Ralph 的实践思路产品化

3. Loop Engineering 引爆讨论(2026.6)

  • Google Cloud AI 总监 Addy Osmani 发布系统博客定义 Loop Engineering
  • 提出五个核心组件 + 内存系统
  • 警告 "理解债"(Comprehension Debt)"认知投降"(Cognitive Surrender)

五、核心设计组件

一个有效的 Loop 系统需要设计:

1. 清晰可验证的目标

  • ❌ "帮我优化一下"------不好
  • ✅ "接口响应时间从 800ms 降到 300ms 以下,所有测试通过"------好
  • 目标必须可自动验证

2. 结构化的上下文管理

  • 太脏/太少/太随机都导致表现差
  • Ralph 方案:每次重置到固定锚点文件
  • 2026 趋势:基于 Git 的状态管理,每轮改动 commit

3. 精简工具集

  • 工具不是越多越好,每增加一个就扩大决策空间
  • 只给完成任务必需的工具

4. 分层评估机制

  • "评估是 Loop 的灵魂"

  • 自动化处理常规判断,Human-in-the-loop 处理高风险决策

  • Claude Code 的实践:生成器(Generator)---评估器(Evaluator)---规划器(Planner) 架构

    • 生成器:构建应用
    • 评估器:独立上下文窗口,用 Playwright 真实测试
    • 规划器:将需求拆解为规格和冲刺

5. 多维度停止条件

  • 成功条件:评估全部通过
  • 失败条件:连续多轮无改进/错误超阈值
  • 资源限制:时间/成本上限
  • 风险检查点:高风险操作前等待人工确认

六,具备哪些能力

从 Prompt → Loop 的演进,要求开发者具备的新能力:

  1. 元提示设计(Meta-Prompting) :不再写具体提示词,而是写生成提示词的规则
  2. 系统架构思维:设计多 Agent 协作拓扑(串行、并行、对抗、投票)
  3. 验证工程:设计可自动化验证的评估体系,而非靠肉眼判断
  4. 状态管理:跨会话持久化上下文,管理长期运行的心智状态
  5. 成本控制:理解 token 消耗模型,在质量与成本间做权衡
  6. 护栏设计:设置安全边界,防止 Agent 失控

七、当前解决什么问题

Loop Engineering 解决的核心矛盾是:

人类注意力有限,AI 执行能力无限 ------ 人无法一直坐在终端前按回车。

具体场景:

场景 Prompt 时代 Loop 时代
代码迁移 人逐文件写 prompt Agent 自动遍历全部文件
Bug 修复循环 人提 bug → 改 → 提交 → 等 CI → 再改 Loop 自动修复 → 验证 → 重试
夜间批处理 人熬夜盯着 提交数百个任务并行执行,明早看结果
持续重构 人手动规划每一步 系统自动拆解任务,持续执行

Boris Cherny 提到,他现在每晚提交 数千个 AI Agent 并行运行,次日早上查看结果。


八、争议与局限

质疑声

  1. Token 消耗:一次 Loop 1 分钟执行一次 × 8 小时 = 480 次 API 调用。批评者指出两位倡导者都有"无限预算"
  2. 调试困难:"调试跑了 47 轮的状态机,比修好一个 prompt 难 10 倍"
  3. 新瓶装旧酒:本质就是 ReAct 范式(2022 年已有论文),或 CI/CD 的 AI 翻版
  4. Concept Fatigue:Vibe Coding → ReAct → Harness → Loop,一年内多个新词
  5. 门槛高:"20 美元的套餐根本不可能"

建设性提醒(Addy Osmani)

  • 理解债(Comprehension Debt) :Agent 产生大量代码,人越来越不读,团队对系统的理解逐渐下降
  • 认知投降(Cognitive Surrender) :Loop 越顺畅,人越容易停止思考

Loop 适合的四个条件:任务高重复性 + 验证已自动化 + 有 Token 预算 + Agent 有完整权限。


九、总结

从 Prompt Engineering 到 Loop Engineering,本质是 人在工作流中的位置不断后撤

  • Prompt Engineering:人亲自发问,控制每一次交互
  • Context Engineering:人管理信息边界,Agent 在边界内自主发挥
  • Harness Engineering:人设安全护栏,Agent 在护栏内跑长程任务
  • Loop Engineering:人设计运转系统,系统决定何时启动 Agent

每一次抽象层级提升,人的决策权上移了一层,但设计难度和系统后果也上升了一档。

正如一位知乎答主所言:

"Context Engineering 让你从在 Prompt 里写细节升级到设计信息边界;Harness Engineering 让你从设计信息边界升级到设计任务安全护栏;Loop Engineering 让你从设计单次任务的护栏升级到设计一项持续职能的运转方式。"

人类工程师的核心价值正从 "写代码/写提示词" 转向 "设计能够持续产出代码的系统"


Sources:

相关推荐
ACP广源盛139246256731 小时前
IX7008 PCIe 交换芯片@ACP#RTX Spark 经济型 8 口扩展芯片(对比 ASM1806)
大数据·人工智能·分布式·嵌入式硬件·gpt·spark·电脑
SEOETC1 小时前
GEO:杭州AI优化企业实战指南
人工智能·搜索引擎
大模型任我行1 小时前
腾讯:原生多模态建模路线图
人工智能·语言模型·自然语言处理·论文笔记
搜移IT科技2 小时前
工业设备更新行动全面推进,通用设备板块增量空间与受益环节解析
人工智能·科技·生活
lauo2 小时前
碳基心脏最后的堡垒——ibbot青春版:你的随身Token生产厂
大数据·人工智能·chatgpt·智能手机·ai-native
大模型任我行2 小时前
谷歌:多模态嵌入Gemini Embedding 2
人工智能·语言模型·embedding·论文笔记
DXM05212 小时前
第13期|遥感语义分割模型:U-Net核心原理+遥感落地优势
人工智能·python·深度学习·目标检测·随机森林·机器学习·支持向量机
碳基硅坊2 小时前
从“打字机”到“印刷机”:聊聊 Google 这只 4 倍速的 DiffusionGemma
人工智能·gemma·diffusiongemma
happyprince2 小时前
08_verl-Workers模块详解
人工智能·架构·强化学习