文章目录
- [5 Harness Engineering](#5 Harness Engineering)
-
- [5.1 关键模块](#5.1 关键模块)
5 Harness Engineering
我们经历了从 Vibe Coding 的随性到 Spec Coding 的严谨。但即便有了完美的规格,AI 在执行任务时依然可能出错、死循环或者误删文件。为了解决这个问题,AI 工程界引入了 Harness Engineering。------量子工具
Harness Engineering(约束系统工程)是 AI 时代的一种全新开发范式。它主张:一个强大的 AI Agent 不仅仅由底层的 LLM 模型决定,更取决于其外围的"约束系统"(Harness)。这个 Harness 系统就像是 AI 模型的"安全带"和"方向盘",负责管理 AI 的环境访问权限、记忆持久化、错误自动恢复以及输出结果的验证。
核心定义:Agent = Model + Harness,Model (大脑)负责理解需求、推理逻辑和生成文本(如 Claude 3.7),Harness (外壳/脚手架)负责环境感知、工具调度、错误恢复和安全约束。
5.1 关键模块
一个完整的 Harness 系统通常包含以下四个关键模块(这是我自己总结的,因为好几个教程里总结的不一样):
- 上下文工程 (Context Engineering):Agent的手册,通过渐进式披露的目录页,从小入口点开始,Agent根据当前任务按需检索和拉取更多的上下文。
- 护栏系统 (Guardrails) : Agent 的安全边界。
- 输入过滤:检测并拦截潜在的注入攻击。
- 输出校验:确保生成的内容符合 JSON 格式、不包含敏感词或不合规的代码。
- 权限控制:AI 尝试运行
rm -rf时,Harness 会在沙盒层将其拦截并报错。
- 记忆管理 (Memory Management) :管理长期记忆。
- 动态检索:根据当前任务从向量库提取历史背景。
- 状态持久化:记录任务执行到哪一步了,即便断电重启,Agent 也能从断点恢复。
- 错误自动恢复 (Error Recovery) :当 AI 运行代码报错时,Harness 会自动捕获报错堆栈,并将其作为反馈输入回 Model,提示其进行修复。这种"自愈"能力是 Harness 的核心价值。
- 自评估系统 (Self-Evaluation) :在输出给用户之前,由另一个轻量级模型(或同一模型的另一个实例)对结果进行打分。如果不合格,Harness 会要求重新执行。
- 熵管理 (Entropy Management) :随着时间推移,软件系统会逐渐混乱(熵增),技术债务会累积。采用持续小额偿还的策略,通过后台定时巡检代码规范偏差、评估代码质量等级,并针对潜在问题自动生成重构合并请求;同时部署专属文档维护智能代理,持续比对代码实现与配套文档的一致性,主动识别过期、失配的文档内容并自动提交更新修复,以智能化方式实现代码与文档的长期协同维护。
Harness类似于DevOps[1](#1),传统的DevOps关注的是编译后的项目,在代码提交或部署时触发,而Harness 关注AI的行为、推理逻辑,在AI执行的每一个步骤确保AI意图对齐、无幻觉、安全。
参考文章:
Harness Engineering 是什么?Agent Harness 核心概念解析
Harness Engineering(驾驭工程)
Harness Engineering 学习指南
- DevOps是融合开发(Dev)与运维(Ops)的工程文化、实践与工具链。通过持续集成(CI)、持续交付(CD)、自动化测试、配置管理、监控告警、容器化等手段,提升系统稳定性。 ↩︎