AI大模型应用(四)——相关技术(下)

文章目录

  • [5 Harness Engineering](#5 Harness Engineering)
    • [5.1 关键模块](#5.1 关键模块)

5 Harness Engineering

我们经历了从 Vibe Coding 的随性到 Spec Coding 的严谨。但即便有了完美的规格,AI 在执行任务时依然可能出错、死循环或者误删文件。为了解决这个问题,AI 工程界引入了 Harness Engineering。------量子工具

Harness Engineering(约束系统工程)是 AI 时代的一种全新开发范式。它主张:一个强大的 AI Agent 不仅仅由底层的 LLM 模型决定,更取决于其外围的"约束系统"(Harness)。这个 Harness 系统就像是 AI 模型的"安全带"和"方向盘",负责管理 AI 的环境访问权限、记忆持久化、错误自动恢复以及输出结果的验证。

核心定义:Agent = Model + Harness,Model (大脑)负责理解需求、推理逻辑和生成文本(如 Claude 3.7),Harness (外壳/脚手架)负责环境感知、工具调度、错误恢复和安全约束。

5.1 关键模块

一个完整的 Harness 系统通常包含以下四个关键模块(这是我自己总结的,因为好几个教程里总结的不一样):

  1. 上下文工程 (Context Engineering):Agent的手册,通过渐进式披露的目录页,从小入口点开始,Agent根据当前任务按需检索和拉取更多的上下文。
  2. 护栏系统 (Guardrails) : Agent 的安全边界。
  • 输入过滤:检测并拦截潜在的注入攻击。
  • 输出校验:确保生成的内容符合 JSON 格式、不包含敏感词或不合规的代码。
  • 权限控制:AI 尝试运行rm -rf时,Harness 会在沙盒层将其拦截并报错。
  1. 记忆管理 (Memory Management) :管理长期记忆。
  • 动态检索:根据当前任务从向量库提取历史背景。
  • 状态持久化:记录任务执行到哪一步了,即便断电重启,Agent 也能从断点恢复。
  1. 错误自动恢复 (Error Recovery) :当 AI 运行代码报错时,Harness 会自动捕获报错堆栈,并将其作为反馈输入回 Model,提示其进行修复。这种"自愈"能力是 Harness 的核心价值。
  2. 自评估系统 (Self-Evaluation) :在输出给用户之前,由另一个轻量级模型(或同一模型的另一个实例)对结果进行打分。如果不合格,Harness 会要求重新执行。
  3. 熵管理 (Entropy Management) :随着时间推移,软件系统会逐渐混乱(熵增),技术债务会累积。采用持续小额偿还的策略,通过后台定时巡检代码规范偏差、评估代码质量等级,并针对潜在问题自动生成重构合并请求;同时部署专属文档维护智能代理,持续比对代码实现与配套文档的一致性,主动识别过期、失配的文档内容并自动提交更新修复,以智能化方式实现代码与文档的长期协同维护。

Harness类似于DevOps[1](#1),传统的DevOps关注的是编译后的项目,在代码提交或部署时触发,而Harness 关注AI的行为、推理逻辑,在AI执行的每一个步骤确保AI意图对齐、无幻觉、安全。

参考文章:
Harness Engineering 是什么?Agent Harness 核心概念解析
Harness Engineering(驾驭工程)
Harness Engineering 学习指南


  1. DevOps是融合开发(Dev)与运维(Ops)的工程文化、实践与工具链。通过持续集成(CI)、持续交付(CD)、自动化测试、配置管理、监控告警、容器化等手段,提升系统稳定性。 ↩︎
相关推荐
mit6.82410 小时前
AI时代下的TypeScript
人工智能
sulikey10 小时前
大模型是如何工作的
人工智能
久违 °17 小时前
【AI-Agent】TagMatrix 数据标注工具开发
人工智能·数据分析·go·agent·数据隐私
AI360labs_atyun17 小时前
腾讯推出电子牛马Marvis,好用吗?
人工智能·科技·ai
Dfreedom.17 小时前
Windows、虚拟机、开发板组网通信原理及调试通联步骤
人工智能·windows·部署·边缘计算·开发板·模型加速
3DVisionary17 小时前
蓝光三维扫描:医疗制造的精度焦虑怎么解
人工智能·算法·制造·蓝光三维扫描·医疗制造·三维检测·义齿检测
Are_You_Okkk_18 小时前
基于MonkeyCode解析AI研发新模式,根治开发低效痛点
大数据·人工智能·开源·ai编程
好评笔记18 小时前
机器学习面试八股——常用损失函数
人工智能·深度学习·算法·机器学习·校招
weixin_4684668518 小时前
全局与局部注意力机制新手实战指南
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
weixin_4684668518 小时前
工业相机成像原理新手入门指南
人工智能·自动化·机器视觉·工业相机·光学·光学系统·成像原理