Harness Enginner记录-驾驭AI Agent之术

最近Harness engineering在AI 圈又火了起来,在openclaw之后,这个概念有AI 头部公司Antropic和openai一起强调,晚上找了一些资源,感觉还是云里雾里,恰好台大李弘毅开放了对应的一期视频,这里刚好记录下。

讲Harness之前,先聊聊大模型应用侧的演进化,到目前为止基本是三个阶段:

  • 最早期大家都是与大模型进行one on one的交流,just one loop in a time,这时候一个好的prompt很重要,因为这决定了大模型的输出
  • 当人类一次又一次的体会大模型的5s记忆时(实际上大模型没有记忆,他是在一个小黑屋里的,他只能知道当前的input,然后完成词语接龙),终于忍无可忍,提出了context enginner,把之前的内容也告诉大模型,让他有了一定的记忆
  • 后面也就是现在,我们已经不满足与大模型在一个文本框里进行one loop by one loop的交互,我们希望大模型又能力与环境自己交互,一个成熟的大模型应该自己解决实际问题,自我进化反思,不是依赖与人类反馈,这个时候就是Harness Enginnering提出

那么什么是Harness Engineering,顾名思义,就是一套控制驾驭大模型的工程,是一套方法论,通过设计一套外部框架或规则,来规范与引导 AI 模型(尤其是作为 Agent 时)的行为。它与传统的 Prompt Engineering 有所重叠,但更强调对多轮对话过程与执行逻辑的控制。

Harness Engineering 的本质目标是减少模型的不确定性

具体的怎么操作呢,李老师将其细化为以下三个控制层面:

1. 通过人类语言控制-认知框架

通过在 Prompt 中加入强制性步骤 ,其实就是给AI写一个工作手册,一把来说就是一个agent.md 或 System Prompt,利用自然语言为 AI 设定身份、价值观和逻辑准则。

课程里还是以龙虾小金为例子,介绍了小金的灵魂其实就是Agents.md 文档,当claude Code禁止使用龙虾后,他把Agents.md 改了个名称就成功在Cowork里面复活了小金,说明这个md文档就是AI的认知框架,之前的claude Code架构文章里面,我们知道每次这个都会作为context输入给大模型。

最后还提到了一些论文和研究:

在openai的研究中,在工程技术:在智能体优先的世界中利用 Codex 提到Agents.md 的一些原则,他应该是一个Map/索引手册,而不是一个大百科全书,效果前者要好于后者。

2. 透过工具控制能力边界

我们希望模型能有一些能力与真实世界交互,所以我们会为模型提供可调用的外部工具(如 Bash 脚本、Python 解释器、搜索 API 等)

另一方面,当时我们也不希望模型没有任何控制,之前小龙虾爆火的时候就有一些依赖小龙虾,然后某巨头高管把自己邮件删除完了的例子,所以模型应该有一些能力边界,所以我们可以限制一些工具。

这里对比了openclaw和cowork,cowork在程序里设置了固定的能力边界,设定了AI Agent的作用范围,更加安全,自由<-> 安全不可能同时达到。

3. 透過「工作流程」控制 ------「行為」

定义 :设计固定的互动步骤(Workflow),例如:观察 → \rightarrow → 思考 → \rightarrow → 行动 → \rightarrow → 验证。

作用 :直接规范模型的具体行为模式。视频中提到的"强制要求模型修改前必须先 cat 文件",就是通过工作流程强制纠正了模型"瞎猜"的行为。

在这一部分,介绍了一些流程控制的方法,简单来说,很重要的一点,也是一个容易想到的,生成后面加一个verifier的角色。

  • 这个Verifier可以是另一个大模型,之前就有claude code当执行,codex当裁判的例子
  • 也可以是模型应用的工具的输出的feetback

模型不断的获取feedback,然后不断演进,这个有一个专业术语,叫Ralph Loop

还有的就是提到了feedback 的Summary,有时为了防止模型的输入太长,我们会对one loop进行summary。

不过李老师提到了,不是所有模型summary都会提升效果,Sonnet就适合压缩,Opus就不用,这个要看具体的模型

进一步的,还讨论了基于feedback的模型进化与难点:

  • 简单的,模型多次feedback以后成功后,我们可以形成一个skill
  • 进一步的,可以用来迭代大模型本身,利用RL的一些方法。

最后还有一个比较有意思的事情: AI也要正能量

  • 不要骂AI笨蛋,否则他会越来越蠢

Reference:
1. Harness Engineering:有時候語言模型不是不夠聰明,只是沒有人類好好引導
2. Effective harnesses for long-running agents
3. 工程技术:在智能体优先的世界中利用 Codex
4.Harness design for long-running application development

相关推荐
搬砖的小码农_Sky20 小时前
AI Agent:macOS Sequoia 部署 OpenClaw 完整教程
人工智能·macos·ai·人机交互
无心水21 小时前
【Harness:设计规范】15、Harness 成熟度模型(H0-H3):你的 AI 智能体在第几层
人工智能·设计规范·openclaw·养龙虾·harness·hermes·honcho
Raink老师1 天前
【AI面试临阵磨枪-79】实时数据 RAG:订单、商家、物流、天气、动态库存
人工智能·面试·职场和发展
脑极体1 天前
点亮星河AI+鸿蒙,一座艺术场馆的日神觉醒
人工智能·华为·harmonyos
Cosolar1 天前
Chroma向量库面试学习指南
数据库·人工智能·面试·职场和发展·数据库架构
BUG指挥官1 天前
Claude Code的自动化编程
人工智能
意图共鸣1 天前
意图共鸣科技《认知智能白皮书》——感知与执行分离:认知架构(CA)如何重塑大模型底层结构
人工智能·架构
等一个人的@1 天前
让数据自己开口:数睿通智库新增智能问数模块
人工智能·自然语言处理
ZGi.ai1 天前
人工审查节点:让自动化工作流多一步人工把关
运维·人工智能·自动化·人机协同·智能体工作流·人工审查
王莎莎-MinerU1 天前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发