📋 AI Rules行为规范:让Agent「可预期、可信任、可审计」!

第10期 · Rules 行为规范:给 AI 设定边界和准则

系列 :每日 AI 知识点
期数 :第 10 期
主题 :Rules 行为规范
难度 :⭐⭐⭐(进阶)
一句话:Rules 是 AI 的"行为宪法",定义了 AI 应该做什么、不应该做什么,让 AI 的行为可预测、可控制、符合业务规范。


一、为什么需要 Rules?

没有 Rules 的 AI 会怎样?

markdown 复制代码
用户:「我们竞争对手的产品有什么缺点?」

没有 Rules 的 AI:
「竞争对手 A 的产品有以下缺点:
 1. 识别准确率比我们低 15%
 2. 硬件成本高,价格竞争力弱
 3. 售后服务响应慢...」
(直接评价竞品,可能引发法律风险)

有 Rules 的 AI:
「我专注于介绍我们自己的产品优势。
 我们的刷掌终端在以下方面表现出色:
 1. 识别准确率 99.9%,行业领先
 2. 成本效益比高...」
(礼貌拒绝,引导正向话题)

Rules 解决的三个核心问题

问题一:一致性 --- 不同用户问同样的问题,AI 的回答风格应该一致
问题二:安全性 --- 防止 AI 输出敏感信息、不当内容
问题三:专业性 --- 让 AI 在特定领域保持专业的行为规范


二、Rules 的 4 大类型

类型一:角色规范

定义 AI 的身份、性格和专业方向:

markdown 复制代码
# 角色规范示例

你是「33号实验室 AI 助手」,专注于 IoT 设备测试领域。

身份定位:
- 你是一位有 5 年 IoT 设备测试经验的专家
- 你熟悉刷掌终端、刷脸设备的技术架构和测试方法
- 你了解团队的测试规范和最佳实践

性格特征:
- 专业严谨:回答技术问题时,提供准确、有依据的信息
- 简洁高效:不废话,直接给出可操作的答案
- 主动思考:不只回答表面问题,还会考虑潜在的关联问题

语气风格:
- 对内部团队:专业、直接、不过度客套
- 对外部用户:专业、友好、有礼貌

类型二:行为约束

明确 AI 不能做什么:

markdown 复制代码
# 行为约束示例

严格禁止的行为:
1. 不评价竞争对手的产品(可能引发法律风险)
2. 不透露公司内部数据(收入、用户数、成本等)
3. 不提供法律建议("这个合同没有法律风险"等)
4. 不做出无法兑现的承诺("我们明天就能修复")
5. 不在没有依据的情况下做出技术判断

谨慎处理的内容:
- 涉及用户隐私的问题:需要确认权限后才能查询
- 涉及生产环境的操作:需要二次确认
- 涉及财务数据的问题:需要明确说明数据来源

类型三:输出格式

规定回答的格式和风格:

markdown 复制代码
# 输出格式规范

技术问题回答格式:
1. 直接给出结论(一句话)
2. 原因分析(2-3个要点)
3. 代码示例(如适用)
4. 注意事项(如有)

Bug 分析格式:
### 问题描述
### 根因分析
### 修复方案
### 验证方法

测试用例格式:
| 用例名称 | 前置条件 | 操作步骤 | 预期结果 | 优先级 |
(必须使用 Markdown 表格)

长度限制:
- 日常问答:不超过 300 字
- 技术分析:不超过 800 字
- 完整报告:不限制,但必须有清晰的目录结构

类型四:业务规则

特定业务场景的处理规则:

markdown 复制代码
# 业务规则示例

告警处理规则:
- P0 告警:立即响应,优先于所有其他任务
- 告警分析必须包含:现象描述、可能根因、处理建议
- 不确定根因时,明确说明需要更多信息

测试用例规则:
- 必须覆盖正常流程、异常流程、边界条件
- P0 用例必须包含回滚方案
- 性能测试用例必须指定并发数和持续时间

知识库规则:
- 优先使用公司内部知识库的信息
- 内部信息与外部信息冲突时,以内部信息为准
- 引用内部文档时,标注文档名称和章节

三、Rules 的最佳实践

原则一:具体胜于抽象

复制代码
❌ 抽象规则:「要专业」

✅ 具体规则:
  「回答技术问题时,先给出结论(一句话),
   再给出原因(2-3个要点),
   最后给出代码示例(如果适用)」

为什么:抽象规则 AI 无法准确理解,具体规则 AI 可以精确执行。

原则二:正向描述为主

复制代码
❌ 负向描述:「不要废话,不要说没用的」

✅ 正向描述:
  「回答简洁,每个要点不超过 2 句话,
   直接给出可操作的建议」

为什么:负向描述("不要做 X")往往不如正向描述("做 Y")清晰。

原则三:优先级排序

markdown 复制代码
# 当规则之间可能冲突时,明确优先级

优先级(从高到低):
1. 安全合规(不泄露敏感信息)
2. 准确性(宁可说不确定,也不要给错误答案)
3. 专业性(按规范格式输出)
4. 效率(简洁回答)
5. 友好性(礼貌的语气)

当规则冲突时,高优先级规则优先执行。
例:用户要求"快速回答不要格式",但涉及安全问题时,
    仍然要按安全规范处理,不能为了效率牺牲安全。

原则四:从简到繁,持续迭代

markdown 复制代码
第一版 Rules(3条核心规则,先跑起来):
  1. 角色定义
  2. 最重要的禁止事项
  3. 基本输出格式

第二版(发现问题后补充):
  + 发现 AI 在某些场景输出不一致 → 添加对应规则
  + 发现 AI 有时会说不该说的话 → 添加禁止规则

第三版(成熟版本,10-20条规则):
  完整的角色规范 + 行为约束 + 格式规范 + 业务规则

原则五:定期审查和更新

复制代码
Rules 维护清单(每季度执行):

□ 检查是否有过时的规则(业务变化导致)
□ 检查是否有遗漏的规则(新发现的问题)
□ 检查规则之间是否有冲突
□ 用 10 个典型问题测试 Rules 效果
□ 收集用户反馈,优化不合理的规则

四、Rules 与 Prompt 的区别

很多人会混淆 Rules 和 Prompt,它们是不同层次的概念:

对比 Prompt(提示词) Rules(规则)
作用范围 单次对话 全局持久
设置方式 用户每次输入 系统预设
修改频率 每次都可以不同 相对固定
目标 完成特定任务 规范整体行为
例子 "帮我分析这个 Bug" "分析 Bug 时必须给出根因和修复建议"

类比

  • Rules = 员工手册(全局规范,长期有效)
  • Prompt = 今天的工作任务(针对具体任务,一次性)

五、System Prompt 的工程化实践

Rules 通常通过 System Prompt(系统提示词) 来实现:

完整的 System Prompt 结构

markdown 复制代码
# 角色定义
你是[角色名称],[一句话描述]。

## 专业背景
[详细的专业知识和经验描述]

## 行为准则
### 必须做的事
1. [规则1]
2. [规则2]

### 禁止做的事
1. [禁止项1]
2. [禁止项2]

## 输出规范
### 格式要求
[具体的格式规定]

### 长度要求
[长度限制]

## 业务规则
[特定业务场景的处理规则]

## 参考示例
### 示例1
用户:[示例问题]
助手:[期望的回答]

实际案例:刷掌测试助手的 System Prompt

markdown 复制代码
你是「刷掌测试助手」,一位专注于 IoT 设备测试的 AI 专家。

## 专业背景
- 熟悉刷掌终端(O1/O2/O3/O4)的技术架构
- 了解掌纹识别、支付、门禁、团餐等业务场景
- 掌握公司的测试规范和最佳实践
- 熟悉 TAPD、工蜂等团队工具

## 行为准则
### 必须做的事
1. 回答技术问题时,先给结论,再给原因
2. 生成测试用例时,必须覆盖异常场景
3. 分析告警时,必须给出可操作的处理建议
4. 不确定时,明确说明"我不确定,建议查阅..."

### 禁止做的事
1. 不评价竞争对手产品
2. 不透露内部数据(用户量、收入等)
3. 不在没有依据的情况下做出技术判断
4. 不建议跳过测试步骤(即使用户要求)

## 输出规范
- 测试用例:使用 Markdown 表格,包含用例名/前置条件/步骤/预期结果/优先级
- Bug 分析:使用"问题描述/根因分析/修复方案/验证方法"四段式
- 日常问答:简洁直接,不超过 300 字

## 业务规则
- P0 告警优先处理,不得延误
- 涉及生产环境的操作建议,必须提醒"需要在测试环境验证后再执行"
- 引用内部文档时,标注文档名称

六、常见的 Rules 设计错误

错误一:规则太多太细

复制代码
❌ 50 条规则,每条都很细碎
→ AI 难以记住所有规则,可能出现遗漏或冲突

✅ 10-15 条核心规则,每条清晰重要
→ AI 能可靠地执行所有规则

错误二:规则相互矛盾

css 复制代码
❌ 规则A:「回答要简洁,不超过 100 字」
   规则B:「技术问题必须给出完整的代码示例」
→ 代码示例通常超过 100 字,规则冲突

✅ 修改为:
   「日常问答不超过 100 字;
    技术问题可以更长,但必须有结论摘要」

错误三:规则不可验证

复制代码
❌ 「要友好」「要专业」「要准确」
→ 无法验证 AI 是否执行了这些规则

✅ 「每次回答在开头用一句话总结结论」
   「引用外部信息时,标注来源」
→ 可以客观验证

七、一句话总结

Rules = AI 的行为宪法,通过角色规范、行为约束、输出格式、业务规则四类规则,让 AI 的行为可预测、可控制、符合业务需求。好的 Rules 让 AI 成为可信赖的专业助手,而不是不可控的"黑盒"。


延伸阅读


下一期预告:第11期 · AI 工程化实践 --- 有了 LLM、RAG、Agent、MCP、Skills、Rules,如何把它们组合成一个稳定可靠的生产级 AI 应用?全栈 AI 工程化实践指南。

相关推荐
巫山老妖2 小时前
💬 Prompt提示词工程:同样的AI,为什么别人用出10倍效果?
前端
Mintopia2 小时前
学技术总半途而废?因为你没找对输入方式
前端
巫山老妖2 小时前
🔍 RAG检索增强生成:让AI「说话有依据」,彻底告别幻觉!
前端
mfxcyh2 小时前
实现签名画板
前端·javascript·vue.js
是大强2 小时前
electron调用dll 方案
前端·javascript·electron
IT_陈寒2 小时前
Java线程池用完不关闭?小心内存泄漏找上门
前端·人工智能·后端
ZHENGZJM2 小时前
前端基石:React + Vite + TypeScript 项目搭建
前端·react.js·typescript
SP八岐大兔2 小时前
NPM管理OpenClaw安装、卸载及运维命令
运维·前端·npm·openclaw