
网罗开发 (小红书、快手、视频号同名)
大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。
图书作者:《ESP32-C3 物联网工程开发实战》
图书作者:《SwiftUI 入门,进阶与实战》
超级个体:COC上海社区主理人
特约讲师:大学讲师,谷歌亚马逊分享嘉宾
科技博主:华为HDE/HDG
我的博客内容涵盖广泛,主要分享技术教程、Bug解决方案、开发工具使用、前沿科技资讯、产品评测与使用体验 。我特别关注云服务产品评测、AI 产品对比、开发板性能测试以及技术报告,同时也会提供产品优缺点分析、横向对比,并分享技术沙龙与行业大会的参会体验。我的目标是为读者提供有深度、有实用价值的技术洞察与分析。
展菲:您的前沿技术领航员
👋 大家好,我是展菲!
📱 全网搜索"展菲",即可纵览我在各大平台的知识足迹。
📣 公众号"Swift社区",每周定时推送干货满满的技术长文,从新兴框架的剖析到运维实战的复盘,助您技术进阶之路畅通无阻。
💬 微信端添加好友"fzhanfei",与我直接交流,不管是项目瓶颈的求助,还是行业趋势的探讨,随时畅所欲言。
📅 最新动态:2025 年 3 月 17 日
快来加入技术社区,一起挖掘技术的无限潜能,携手迈向数字化新征程!
文章目录
-
- 引言
- [一、问题本质:AI 系统正在失控边缘](#一、问题本质:AI 系统正在失控边缘)
- [二、为什么 Policy Engine 不够](#二、为什么 Policy Engine 不够)
- [三、AI Governance 的完整分层](#三、AI Governance 的完整分层)
- [四、第一层:Governance Layer](#四、第一层:Governance Layer)
- [五、第二层:Policy Engine](#五、第二层:Policy Engine)
- 六、第三层:Guardrails
- [七、第四层:Runtime Monitor](#七、第四层:Runtime Monitor)
- [八、第五层:Agent / Model](#八、第五层:Agent / Model)
- 九、关键设计一:策略不是写死的
- 十、关键设计二:决策可解释
- 十一、关键设计三:分级治理
- 十二、关键设计四:端云协同治理
- 十三、关键设计五:治理闭环
- [十四、结合 OpenClaw 的治理实现](#十四、结合 OpenClaw 的治理实现)
- [十五、为什么 AI Governance 是下一阶段核心](#十五、为什么 AI Governance 是下一阶段核心)
- 总结
引言
当我们把 AI 从"云端大模型"带到"端侧系统",一个问题会变得越来越关键:
AI 不只是要"聪明",更必须"可控"。
很多团队一开始做 AI 系统时,关注的是:
模型效果怎么样?
推理准不准?
响应快不快?
但当系统真正上线之后,你会发现:
错误决策
越权操作
资源滥用
不可预测行为
这些问题,比"效果不好"更致命。于是,一个新的问题浮现出来:
AI 的行为,谁来约束?
答案就是:
AI Governance(AI 治理体系)
而在这个体系中,Policy Engine 只是开始。
一、问题本质:AI 系统正在失控边缘
在传统软件中:
输入 → 代码逻辑 → 输出
一切都是"确定的"。但在 AI 系统中:
输入 → 模型推理 → 不确定输出
本质变化
从"确定系统"
→ "概率系统"
这带来了三个核心风险:
1、不确定性
同样输入 → 不同输出
2、不可解释
为什么这么做?不知道
3、不可约束
模型可以"乱来"
二、为什么 Policy Engine 不够
很多人第一反应是:
"加一层 Policy Engine,不就解决了吗?"
确实,Policy Engine 可以做:
权限控制
行为过滤
规则判断
示例
ts
if (intent === "delete_all_data") {
deny();
}
但问题在于:
Policy Engine 只是"规则判断器",不是"治理系统"。
它解决的是:
单点决策
但 AI 系统需要的是:
全流程治理
三、AI Governance 的完整分层
一个完整的 AI 治理体系,至少包含 5 层:
┌────────────────────┐
│ Governance Layer │(治理策略层)
├────────────────────┤
│ Policy Engine │(策略执行层)
├────────────────────┤
│ Guardrails │(行为约束层)
├────────────────────┤
│ Runtime Monitor │(运行监控层)
├────────────────────┤
│ Model / Agent │(执行层)
└────────────────────┘
核心思想
不是"拦一次",而是"全链路可控"。
四、第一层:Governance Layer
这是最容易被忽略的一层。
它负责什么?
定义规则
定义边界
定义风险等级
示例
yaml
rules:
- name: "禁止敏感操作"
level: high
actions:
- delete_data
- transfer_money
- name: "限制资源使用"
level: medium
cpu_limit: 30%
本质
把"人类决策"结构化。
五、第二层:Policy Engine
这一层,是治理体系的"执行大脑"。
它负责什么?
解析策略
匹配上下文
做出决策(Allow / Deny / Modify)
示例
ts
function evaluate(intent, context) {
if (intent === "transfer_money" && context.amount > 1000) {
return "deny";
}
return "allow";
}
特点
实时
确定性强
可测试
六、第三层:Guardrails
如果说 Policy Engine 是"决策",那 Guardrails 是"兜底"。
它负责什么?
输入校验
输出过滤
异常保护
示例
ts
if (output.containsSensitiveInfo()) {
output = mask(output);
}
关键点
Guardrails 是最后一道防线。
七、第四层:Runtime Monitor
这是很多系统缺失的一层。
它负责什么?
行为记录(Logging)
异常检测
实时告警
动态干预
示例
ts
if (agent.loopCount > 1000) {
triggerAlert();
stopAgent();
}
本质
让 AI "可观测"。
八、第五层:Agent / Model
这是 AI 的"执行者"。但在治理体系中,它的地位反而是:
被约束者,而不是主导者。
原则
模型不可信
必须被限制
必须被监控
九、关键设计一:策略不是写死的
传统规则系统的问题是:
写死在代码里
难以修改
无法动态调整
正确方式
配置化
可热更新
可灰度发布
示例
json
{
"rule": "limit_api_call",
"threshold": 100,
"enabled": true
}
十、关键设计二:决策可解释
AI 系统必须回答一个问题:
"为什么这么做?"
实现方式
决策日志
规则命中记录
推理链路追踪
示例
json
{
"decision": "deny",
"reason": "amount > 1000",
"policy": "transfer_limit"
}
十一、关键设计三:分级治理
不是所有行为都要严格控制。
分级策略
低风险 → 放行
中风险 → 限制
高风险 → 拦截
示例
ts
if (riskLevel === "high") {
requireHumanApproval();
}
本质
把治理成本最小化。
十二、关键设计四:端云协同治理
在端侧 AI 中,治理不能只在本地。
推荐架构
端侧:
- 快速拦截
- 基础规则
云端:
- 全局策略
- 风险分析
- 模型审计
示例
端侧:检测异常行为 → 上报
云端:分析风险 → 下发新策略
十三、关键设计五:治理闭环
真正成熟的 AI Governance,一定是"闭环"。
流程
行为发生
↓
监控捕获
↓
风险分析
↓
策略更新
↓
重新生效
本质
系统会"自我收敛"。
十四、结合 OpenClaw 的治理实现
如果把这一套放进 OpenClaw-like 系统中:
原始系统
Trigger → Action
加入治理之后
Trigger
↓
Intent(小模型)
↓
Policy Engine
↓
Guardrails
↓
Action
↓
Monitor
↓
Feedback
变化
从"能跑"
→ "可控运行"
十五、为什么 AI Governance 是下一阶段核心
未来 AI 系统的竞争,不再只是:
模型谁更大
效果谁更好
而是:
谁更稳定
谁更可控
谁更可信
尤其在:
端侧 AI
企业 AI
Agent 系统
自动化系统
治理能力,将成为"基础设施"。
总结
从 Policy Engine 到完整 AI Governance,我们可以总结为:
Policy Engine:做决策
Guardrails:做保护
Monitor:做观测
Governance:做策略
最终目标只有一个:
让 AI 从"不可控智能",变成"可治理系统"。