Harness Enginner记录-驾驭AI Agent之术

最近Harness engineering在AI 圈又火了起来，在openclaw之后，这个概念有AI 头部公司Antropic和openai一起强调，晚上找了一些资源，感觉还是云里雾里，恰好台大李弘毅开放了对应的一期视频，这里刚好记录下。

讲Harness之前，先聊聊大模型应用侧的演进化，到目前为止基本是三个阶段:

最早期大家都是与大模型进行one on one的交流，just one loop in a time，这时候一个好的prompt很重要，因为这决定了大模型的输出
当人类一次又一次的体会大模型的5s记忆时（实际上大模型没有记忆，他是在一个小黑屋里的，他只能知道当前的input，然后完成词语接龙），终于忍无可忍，提出了context enginner，把之前的内容也告诉大模型，让他有了一定的记忆
后面也就是现在，我们已经不满足与大模型在一个文本框里进行one loop by one loop的交互，我们希望大模型又能力与环境自己交互，一个成熟的大模型应该自己解决实际问题，自我进化反思，不是依赖与人类反馈，这个时候就是Harness Enginnering提出

那么什么是Harness Engineering，顾名思义，就是一套控制驾驭大模型的工程，是一套方法论，通过设计一套外部框架或规则，来规范与引导 AI 模型（尤其是作为 Agent 时）的行为。它与传统的 Prompt Engineering 有所重叠，但更强调对多轮对话过程与执行逻辑的控制。

Harness Engineering 的本质目标是减少模型的不确定性

具体的怎么操作呢，李老师将其细化为以下三个控制层面：

1. 通过人类语言控制-认知框架

通过在 Prompt 中加入强制性步骤 ，其实就是给AI写一个工作手册，一把来说就是一个agent.md 或 System Prompt，利用自然语言为 AI 设定身份、价值观和逻辑准则。

课程里还是以龙虾小金为例子，介绍了小金的灵魂其实就是Agents.md 文档，当claude Code禁止使用龙虾后，他把Agents.md 改了个名称就成功在Cowork里面复活了小金，说明这个md文档就是AI的认知框架，之前的claude Code架构文章里面，我们知道每次这个都会作为context输入给大模型。