AI Agent 从演示走向生产环境时,问题通常不再是"模型能不能回答",而是它能否接入真实数据、遵守权限边界、稳定处理异常,并且和已有系统形成可维护的工程链路。
这篇文章只讨论一个偏工程化的问题:如果要把 AI Agent 放进企业业务流程,通常需要拆成哪些环节,以及每个环节要关注什么。
1. 先定义业务边界,而不是先选模型
很多 AI Agent 项目一开始会直接讨论模型、框架、向量库或插件系统。但在真实项目里,更早需要明确的是业务边界:
- 谁在使用这个 Agent;
- 用户能问什么,不能问什么;
- Agent 可以读取哪些数据;
- 哪些动作只能建议,不能自动执行;
- 结果是否需要人工复核;
- 失败时如何降级处理。
这些问题不先说清楚,后面很容易出现"演示可用、上线不可控"的情况。
一个简单的需求边界表可以这样设计:
| 项目 | 示例 |
|---|---|
| 使用角色 | 客服、运营、销售、管理人员 |
| 数据来源 | 文档库、业务系统、工单、设备数据 |
| 输出类型 | 问答、摘要、流程建议、风险提示 |
| 权限规则 | 按角色、部门、项目或数据等级控制 |
| 人工复核 | 高风险内容必须进入人工确认 |
| 验收指标 | 命中率、延迟、可追溯性、异常处理 |
2. 数据接入要区分"可检索"和"可执行"
企业数据接入通常可以分成两类:
- 知识型数据:文档、制度、FAQ、产品资料、项目记录;
- 业务型数据:订单、工单、客户状态、设备状态、审批流程。
知识型数据更适合进入 RAG 检索链路,业务型数据更适合通过 API 查询或工作流节点调用。
常见链路如下:
text
用户问题
-> 意图识别
-> 权限判断
-> 知识检索 / API 查询
-> 上下文组装
-> 模型生成
-> 结果校验
-> 返回答案 / 进入人工复核
这里要避免把所有资料一次性丢进向量库。更稳妥的做法是先整理数据结构、更新频率、权限范围和引用来源。
3. Agent 能力要按场景拆分
不是所有场景都需要复杂的多 Agent 编排。可以先按任务复杂度分层:
| 类型 | 适合场景 | 关键点 |
|---|---|---|
| 问答型 Agent | FAQ、制度查询、产品资料查询 | 检索质量、引用来源、权限过滤 |
| 流程型 Agent | 工单流转、资料收集、服务预约 | 状态机、节点校验、异常回退 |
| 数据型 Agent | 报表解释、指标分析、风险提示 | 数据口径、SQL/API 安全、结果校验 |
| 任务型 Agent | 多步骤操作、跨系统协同 | 工具调用、审计日志、人工确认 |
如果业务流程还没有梳理清楚,直接做复杂 Agent 编排,后续维护成本会很高。
4. 系统集成重点是权限、日志和回退
AI Agent 接入生产系统时,至少要考虑三个工程问题。
第一是权限控制。
模型不应该绕过系统原有权限。检索、查询、调用工具之前,都应该先完成用户身份和数据范围判断。
第二是日志追踪。
一次回答最好能记录输入、检索来源、调用工具、模型版本、关键提示词版本和输出结果,方便后续排查。
第三是异常回退。
当检索为空、接口失败、模型输出不确定或命中敏感边界时,系统需要给出明确的降级路径,而不是继续生成看似完整但不可验证的答案。
可以把一次请求抽象成下面的对象:
json
{
"user_id": "u_001",
"role": "customer_service",
"intent": "query_policy",
"data_scope": ["public_docs", "project_docs"],
"tools": ["search_docs"],
"need_human_review": false,
"trace_id": "agent_20260608_001"
}
这个对象不一定要照搬,但类似的结构化记录有助于后续审计和调试。
5. 测试不能只看回答是否"像样"
AI Agent 的测试应尽量覆盖以下内容:
- 正常问题是否能命中正确资料;
- 无答案时是否会承认不知道;
- 不同角色是否只能看到自己有权限的数据;
- 接口失败时是否能降级;
- 高风险动作是否进入人工确认;
- 回答是否保留引用来源;
- 提示词、知识库或模型更新后是否有回归测试。
可以准备一组固定测试集,每次调整知识库、提示词或模型版本后重新跑一遍,避免"局部优化导致整体退化"。
6. 上线后要持续迭代知识和流程
AI Agent 上线不是结束。生产环境里真正有价值的反馈通常来自:
- 用户没有问出来但实际需要的问题;
- 检索命中但答案不完整的问题;
- 同一个问题被不同用户反复提问的问题;
- 人工频繁修正的回答;
- 接口调用失败或超时的链路。
这些反馈可以反向推动知识库整理、流程节点调整、提示词优化和系统接口补齐。
小结
企业 AI Agent 落地,本质上是一个软件工程问题。模型能力很重要,但需求边界、数据治理、权限控制、系统集成、测试验收和持续迭代同样重要。
如果只把它当成一个聊天工具,通常很难进入真实业务;如果把它当成一个可审计、可回退、可维护的系统能力,落地路径会清晰很多。