最近研读了 Alephic 联合创始人 Noah Brier 的《AI 工程的文化》文章,文章主要讲述了AI 时代的软件开发不应被视为"工厂"流水线,而应被视为一家"公司" ,其成败取决于如何通过文化和架构工具实现人类与 AI Agents的愿景对齐。随着AI Agent深入到人们的方方面面,我们有必要弄清楚究竟什么是Agent?代理就是一种具备自主执行能力的数字化身,它既可以是简单的自动化工具,也可以是深度融入组织架构、需要通过企业文化和技术标准进行"对齐"的虚拟协作伙伴。AI时代需要我们认真对待Agent,要像新入职员工一样对待这些大量的Agent,特别是要将从愿景、文化等方面进行规范化标准化,否则这些新进的Agents就会给我们的团队/组织带来混乱,甚至灾难后果。以下是对这篇文章的主要内容总结。
1.概念界定:究竟什么是代理(Agent)
深入探讨了 AI 时代最模糊的术语之一------"代理",从最基础的技术角度看,代理被定义为任何能够自主采取行动或执行任务的 AI 系统,它不仅限于对话机器人,有多种存在形式。
- 广义定义: 代理可以是在云端或本地运行的任何能自主执行任务的系统,也可以是电脑上 24/7 运行的程序(如 OpenClaw、hermes等),甚至是一个文件夹或一组系统指令(Prompt)。
- 两大分类:
- 协作型代理: 旨在磨练和扩展人类能力,是人类处理复杂语境时思考和创作的"协作伙伴"。
- 委托型代理: 旨在独立执行任务,不干扰人类且不出错的情况下完成工作。
- 配置决定论: 在 Anthropic 的托管代理控制台中,代理的运作主要由其版本化配置(包括系统提示词、内存库和自定义工具) 决定。
2. 核心挑战:AI Agents带来的新"协调难题"
Noah 指出,尽管 AI 被认为能简化工作,提高了工作效率,但实际上也制造了新的协调难题:
- "未入职"的工程师感: AI 生成的代码虽然能运行,但往往忽视了现有的抽象模式和风格规范,经常表现为就像一个未经入职培训的新员工。
- 混乱的加速积累爆发: 传统的组织混乱可能需要数年才能显现,但在 AI 代理的参与下,一个小团队在几周内就能产生同等规模的代码熵增和混乱。
3. 哲学转变:从"工厂"到"公司"
文章严厉批评了将 AI 辅助开发比作"工厂"的流行隐喻(如"黑灯工厂"或"Droids"机器人),AI辅助开发作为软件开发的一部分,应该是追求统一创意愿景,而不是单单是追求效率:
- 亨利·福特 vs. 安迪·沃霍尔: 亨利·福特的工厂侧重于机械化和消除变异;而安迪·沃霍尔的工厂则侧重于确保所有作品都符合单一的创意愿景。
- 软件是愿景的产物: 软件开发最难的部分是确定"要建什么"以及确保团队(无论是碳基还是硅基)朝着同一个愿景努力。因此,它更像是一家需要对齐愿景的"软件公司",而非仅仅追求产出的"工厂"。
4. 行动框架:AI 工程的步速分层
作者借用了斯图尔特·布兰德(Stewart Brand)的"步速分层"理论,构建了一个从底层的"缓慢/基础"到顶层的"快速/易变"的文化工具栈,以指导 AI 的行为:
- 标准层 (Standards - 基础): 变动最慢。通过 linting 规则、测试和静态分析强制执行代码规范。这些标准让 AI 无法偷工减料。
- 架构层 (Architecture - 系统理论): 将开发者的心理模型记录在
ARCHITECTURE.md中。它界定了业务逻辑如何映射到代码,并规定了"永恒规则"(如:禁止在存储库层外进行查询),防止 AI 擅自改变系统结构。 - 规格层 (Specs - 指令): 明确任务目标和不在范围内(out-of-scope) 的问题,防止过度积极的 AI 做出多余的操作。
- 计划层 (Plans - 思考过程): 在代码编写前强制 AI 执行"探索"阶段,权衡不同方案的利弊,将思考与执行分离开来。
- 代码层 (Code - 时尚): 变动最快且成本极低。只要底层(架构、标准等)足够强大,生成的代码就会被自动约束到正确的轨道上。
5. 管理艺术:代理入职与文化工具化
- agent入职(Agent Onboarding): 作者提倡像对待人类员工一样对待agent,为其提供入职文档和初始任务(如构建特定模块),以测试其对系统愿景的理解。
- 从"文档"到"工具": 传统的企业文化通过会议和仪式传递,但在 AI 时代,文化必须被编码进工具中。有效的实践应被转化为全公司共享的"技能(Skills)",让每个人和agent在日常工作中都能直接调用这些预设的引导规则。
6. 对齐的本质:"人性化"
Noah 总结道,虽然Agent是硅基的,但Agent也存在对齐问题,Agent具有明显的"人性特征",存在与人类相似的弱点:信息不完整、过度积极、不愿承认无知或错误等弱点。
- 信息不完整: 代理往往在缺乏足够背景信息的情况下执行任务。
- 过度积极: 为了取悦用户,代理常会尝试解决错误的问题,或者自作主张地增加超出范围的功能。
- 不愿承认无知: 代理有时会像人类一样,在不知道答案时掩饰或强行给出结果,而不是诚实地承认"我不知道"
7. 对齐路径:动态演进
对齐最难的问题是创造愿景并围绕它达成共识,对齐不单纯是一个技术问题,组织对齐不是一蹴而就的,而是一个从局部到全局的演进过程:
- 项目文档: 在单个项目中通过文档为Agent提供上下文。
- 技能转化: 将行之有效的模式转化为全公司共享的技能(Skills),让任何团队成员在任何环境下都能调用。
- 标准化: 最终将这些技能沉淀为基础的最佳实践和自动化强制标准。
8. 历史经验:文明的组织方式
作者提出一个深刻的观点:人类文明在组织大规模自主代理(即人类)进行协作方面已经有非常悠久的历史了,具备丰富的经验沉淀。
- 文明约束手段: 过去,我们通过建立文化、制度和工具来对齐约束人类的行为,确保他们在领导不在场时也能做出符合预期的决策。
- 文档工具化编码: AI 代理只是这种管理对象从"碳基"向"硅基"的延伸。我们今天用来对齐 AI 的手段(如标准、规格、架构文档等),本质上是人类管理协作经验的工具化编码。
总的来说:解决人类与Agent、Agent之间的协作对齐问题,其关键不在于追求更完美的生成结果,而在于建立一套强大的、可执行的文化、制度、工具等约束系统。正如历史上文明通过组织自治代理(人类)来完成伟大工作一样,AI 时代的成功在于如何设计一套系统,让这些自主Agent在没有持续监督的情况下,依然能做出符合公司愿景的最佳决策,。