从“辅助建议“到“生产执行“:OpenClaw 落地的四层安全架构设计

大家好,我是玄姐。

PS:

SDD AI 编程干货直播,欢迎点击预约,直播见。

导语:Coding Agent 已率先跑通,业务 Agent 却难觅现象级产品。差距不在模型能力,而在工程环境的本质差异。本文提出一套四层控制空间架构,探讨如何将开放、分散、难回滚的业务环境,重构为 Agent 可安全自主执行的生产空间。

1、现状:为什么只有 Coding Agent 先跑通了?

2024 年初至今,Coding Agent 的返工率从约 50% 下降到 20%,成为 AI Agent 赛道最先落地的场景。而业务 Agent(如 OpenClaw 面向的通用业务场景)却迟迟未能出现同等量级的突破。

表面解释是"代码更适合大模型处理"。但这遮蔽了真正的原因:

代码世界是一个被工程系统包裹过的"安全复杂"环境,天然具备 Agent 稳定工作的四大特征:

特征 代码环境表现 业务环境现状
可视化 代码、目录、依赖、接口、提交记录、Review 历史清晰可见 信息散落在 IM、表格、邮件、后台系统和人脑经验中
相对封闭 输入(仓库/文档/规范)与输出(代码/测试结果/构建产物)边界明确 任务边界动态变化,执行到一半经常变形
可验证 TypeCheck、Test、Build、CI、Code Review 构成多层验证 缺乏统一验证标准,只能"做了再看"
可回滚 分支、PR、Revert、Tag、回退发布机制成熟 改价格、投广告、发促销等动作往往不可逆

结论:业务环境本身并不适合 Agent 稳定工作。若不改造环境,Agent 能力越强,破坏力反而越大。

2、核心架构:四层控制空间模型

要让业务 Agent 从"辅助建议"进化为"生产系统执行单元",必须将开放环境重构为可视化、相对封闭、可验证、可回滚的控制空间。

我们提出四层控制空间架构:

第一层:可视化层(建立控制感)

目标:让 Agent 行为全程可观测

核心机制:

  • 执行轨迹追踪:谁在做什么、依据什么做、当前进展到哪一步

  • 产物透明化:Agent 生成的配置快照、变更提案、对比数据必须结构化存储

  • 审批链路可见:谁批准、谁驳回、哪些动作已作用于外部系统,哪些仍是提案状态

技术要点:可视化不是为了好看,而是为了建立基础控制感,避免信息散落在 IM 和口头同步中。

第二层:封闭层(任务单元封装)

目标:将开放世界的模糊动作,重构为边界明确的执行单元

核心机制:

  • 输入输出契约化:明确任务单元的输入数据格式与输出产物标准

  • 权限沙盒化:定义可访问的系统列表、可操作的对象范围

  • 审批节点内嵌:关键状态转换必须经人工或规则审批

架构意义:没有封闭层,Agent 只能停留在"辅助建议"阶段,无法稳定进入"自主执行"。

第三层:验证层(建立门禁系统)

目标:回答"这次动作,凭什么算通过?"

核心机制:

  • 规则校验:库存阈值、预算上限、品牌规范等业务规则自动校验

  • 沙盘点验:高风险动作先在模拟环境推演,验证预期影响

  • 人工门禁:关键变更必须经过审批流(Approval Gate)

技术实现:不同业务场景需构建垂直领域的验证逻辑。电商场景需要库存校验与投放限制,运营场景需要数据口径一致性与灰度结果验证。

第四层:回滚层(恢复稳定状态)

目标:建立"恢复稳定状态"的工程能力

核心机制:

  • 延迟执行:正式生效前预留审核窗口期

  • 灰度发布:渐进式暴露变更,降低 blast radius

  • 失败补偿:自动触发回退或补偿动作,达成最终一致性

  • 快照备份:关键变更前的状态快照,支持快速回滚

  • 沙盘推演:不可逆动作先在模拟环境跑通,再进入真实世界

关键认知:业务场景的回滚≠简单的撤销。很多动作天然不可逆,需要的是一套恢复稳定状态的系统性能力。

3、工程实践:Amazon Canvas 的沙盘机制

Amazon 在电商场景中构建的 Agent Canvas 机制,是四层架构的典型落地:

核心逻辑:

  • 方案创建:Agent 生成多个候选策略(如市场策略 A、运营优化 B)

  • 模拟沙盘:将问题、方案、预期影响、风险、资源消耗映射到可视化画布

  • 讨论与对比:不同方案在沙盘中进行成本/风险/收益的横向对比

  • 审核决策:人工审核通过后,生成部署指令

  • 正式生效:变更进入真实系统

架构价值:

  • 将复杂、开放、不可逆的管理动作,转化为可推演、可比较、可审查的提案

  • 保留人的交互选择权,降低直接作用于真实系统的不确定性

  • 不同 Canvas 版本具备类似 Git 的版本管理特征

这正是四层架构的核心思想:提供一个"代理现实"的操作空间,让决策先在安全空间被验证,再进入真实世界。

4、总结与展望

核心判断:Agent 能否在业务中落地,瓶颈不在模型能力或多 Agent 架构,而在于是否构建了安全的工程环境。

企业落地路径:

  • 基建先行:不要急着上更强大的模型或更复杂的 Agent 编排,先改造业务环境

  • 四层改造:按"可视化→封闭化→验证化→可回滚"的层级,逐步构建控制空间

  • 沙盘机制:对高风险业务动作,必须建立"模拟验证→决策审批→安全发布"的流程

最终形态:

  • 当前阶段:Agent 作为辅助建议工具(Agent Current)

  • 未来目标:Agent 成为生产系统的稳定自主执行单元(Agent Future)

只有当四层控制空间架构完备,Agent 才能真正蜕变为具备企业级 Know-How 的"资深老员工",而非偶尔闯祸的"聪明实习生"。

好了,这就是我今天想分享的内容。如果你对构建企业级 AI 原生应用新架构设计和落地实践感兴趣,别忘了点赞、关注噢~

PS:

SDD AI 编程干货直播,欢迎点击预约,直播见。

---1---

加我微信

扫码加我👇有很多不方便公开发公众号的我会直接分享在朋友圈,欢迎你扫码加我个人微信来看👇

加星标★,不错过每一次更新!

⬇戳"阅读原文",立即预约!