• 把企业 AI 应用放成下面这张"总图"最容易理解。
总架构图
用户 / 渠道
Web / App / IM / API / 企业微信 / 钉钉
|
v
+-----------------------------+
| 接入层 |
| API Gateway / Auth / Rate |
| SSO / 租户 / 审计入口 |
+-----------------------------+
|
v
+-----------------------------+
| 应用层 |
| AI 助手 / 知识问答 / 客服 |
| 工单助手 / 报告生成 / Copilot|
+-----------------------------+
|
v
+---------------------------------------------------+
| 编排层 |
| Workflow Engine / Policy Router / HITL / State |
| 重试 / 超时 / 审批 / 回滚 / 任务编排 / 成本控制 |
+---------------------------------------------------+
|
+-------------------+-------------------+
| | |
v v v
+----------------+ +----------------+ +------------------+
| Agent Runtime | | RAG Service | | Tool/Skill Hub |
| 任务拆解 | | 检索/召回/重排 | | API/脚本/系统能力 |
| 工具调用 | | 上下文拼装 | | ERP/CRM/DB/Git |
| 多步决策 | | 引用来源 | | 工单/测试平台 |
+----------------+ +----------------+ +------------------+
| | |
+-------------------+-------------------+
|
v
+---------------------------------------------------+
| 模型服务层 |
| LLM Router / Prompt Templates / Structured Output |
| GPT / LLaMA / 小模型 / Embedding / Reranker |
+---------------------------------------------------+
|
v
+---------------------------------------------------+
| 数据层 |
| 文档库 / 对象存储 / 向量库 / 业务库 / 缓存 |
| 会话记忆 / 用户画像 / 历史工单 / 日志 / 反馈 |
+---------------------------------------------------+
|
v
+---------------------------------------------------+
| 平台治理层 |
| 观测 / Tracing / Eval / 安全 / 脱敏 / 权限 |
| 内容审核 / 成本分析 / A/B / Prompt版本 / 审计 |
+---------------------------------------------------+
这几个东西怎么放在一起
- 模型
是底层智能引擎,负责理解、推理、生成、分类、embedding、rerank。
- RAG
不是单独替代模型,而是模型前的一层"查资料系统"。
它负责把企业私有知识找出来,再交给模型回答。
- Agent
是执行者。适合处理"目标明确,但路径不固定"的任务。
它会调用 RAG、Skill、工具和模型。
- 工作流
是骨架和总控。负责稳定流程、状态管理、审批、重试、回滚。
企业系统里,通常应该由工作流来管主干,不要让 Agent 接管全部流程。
- Skill
是标准化能力包,比如"查订单""分析日志""生成测试报告""查知识库"。
一句话关系:
Workflow 管主线,Agent 处理复杂节点,RAG 提供知识,Model 提供智能,Skill 提供动作能力。
企业里最稳的摆法
不是所有请求都直接进 Agent,而是这样分层:
-
先由 Workflow / Router 判断任务类型
-
能走固定流程的,直接走固定流程
-
需要知识支撑的,调用 RAG
-
需要复杂判断和工具协作的,进入 Agent
-
高风险动作经过 规则 + 人工审批
-
全程记录状态、日志、成本、效果
两条典型链路
- 企业知识问答
用户提问
-> 权限校验
-> 意图识别
-> RAG 检索文档
-> 重排
-> LLM 生成答案
-> 引用来源
-> 审核/脱敏
-> 返回
这条链路通常不需要 Agent。
RAG + Workflow + Model 就够了。
- 复杂业务助手
比如:"帮我分析这次测试失败原因,并通知负责人"
用户下达任务
-> Workflow 创建任务状态
-> Agent 拆解步骤
-> 调日志系统 / 测试平台 / Git / 知识库
-> RAG 查历史故障和 runbook
-> 模型分析归因
-> Workflow 判断是否需要人工确认
-> 发送通知 / 创建工单
-> 记录结果
这条链路里,Agent 才有价值。
建议你这样理解职责边界
- Workflow
负责"流程必须怎么走"
- Agent
负责"这件事怎么做出来"
- RAG
负责"去哪里找企业知识"
- Model
负责"怎么理解和生成"
- Skill/Tool
负责"真正去执行动作"
企业级一定要补上的横向能力
如果没有下面这些,就不算完整企业架构:
- 权限
不同用户只能看到自己有权看的知识和数据
- 审计
记录谁问了什么、系统用了什么资料、执行了什么动作
- 观测
看得见每一步耗时、token、失败点、工具调用链路
- 评测
不只是"能回答",还要看正确率、幻觉率、命中率、人工满意度
- 安全
脱敏、提示注入防护、越权访问防护、内容安全
- 成本治理
简单任务走小模型,复杂任务走大模型,检索先于生成
一个很实用的落地原则
企业系统里,通常应该是:
-
80% 用 Workflow + RAG + Rules
-
20% 再让 Agent 出场
因为大多数企业任务本质上是流程化的,不是完全开放式问题。
如果你要落地,我建议的默认技术形态
-
主干:Workflow
-
知识问答:RAG + LLM
-
复杂操作节点:Agent
-
外部能力接入:Skill / Tools
-
风险控制:Rules + HITL
-
生产治理:Observability + Eval + Security
一句总结
企业 AI 架构不是"把一个大模型接上去"就完了,而是:
用 Workflow 保证可控,用 RAG 接入企业知识,用 Agent 处理复杂任务,用模型提供智能,用治理层保证它能长期上线运行。