企业 AI 应用完整技术架构图：模型、RAG、Agent、工作流怎么放在一起

• 把企业 AI 应用放成下面这张"总图"最容易理解。

总架构图

用户 / 渠道

Web / App / IM / API / 企业微信 / 钉钉

+-----------------------------+

| 接入层 |

| API Gateway / Auth / Rate |

| SSO / 租户 / 审计入口 |

+-----------------------------+

| 应用层 |

| AI 助手 / 知识问答 / 客服 |

| 工单助手 / 报告生成 / Copilot|

+-----------------------------+

+---------------------------------------------------+

| 编排层 |

| Workflow Engine / Policy Router / HITL / State |

| 重试 / 超时 / 审批 / 回滚 / 任务编排 / 成本控制 |

+---------------------------------------------------+

+-------------------+-------------------+

| | |

v v v

+----------------+ +----------------+ +------------------+

+----------------+ +----------------+ +------------------+

| | |

+-------------------+-------------------+

+---------------------------------------------------+

| 模型服务层 |

| LLM Router / Prompt Templates / Structured Output |

| GPT / LLaMA / 小模型 / Embedding / Reranker |

+---------------------------------------------------+

| 数据层 |

| 文档库 / 对象存储 / 向量库 / 业务库 / 缓存 |

| 会话记忆 / 用户画像 / 历史工单 / 日志 / 反馈 |

+---------------------------------------------------+

| 平台治理层 |

| 观测 / Tracing / Eval / 安全 / 脱敏 / 权限 |

| 内容审核 / 成本分析 / A/B / Prompt版本 / 审计 |

+---------------------------------------------------+

这几个东西怎么放在一起

模型

是底层智能引擎，负责理解、推理、生成、分类、embedding、rerank。

不是单独替代模型，而是模型前的一层"查资料系统"。

它负责把企业私有知识找出来，再交给模型回答。

Agent

是执行者。适合处理"目标明确，但路径不固定"的任务。

它会调用 RAG、Skill、工具和模型。

工作流

是骨架和总控。负责稳定流程、状态管理、审批、重试、回滚。

企业系统里，通常应该由工作流来管主干，不要让 Agent 接管全部流程。

Skill

是标准化能力包，比如"查订单""分析日志""生成测试报告""查知识库"。

一句话关系：

Workflow 管主线，Agent 处理复杂节点，RAG 提供知识，Model 提供智能，Skill 提供动作能力。

企业里最稳的摆法

不是所有请求都直接进 Agent，而是这样分层：

先由 Workflow / Router 判断任务类型
能走固定流程的，直接走固定流程
需要知识支撑的，调用 RAG
需要复杂判断和工具协作的，进入 Agent
高风险动作经过规则 + 人工审批
全程记录状态、日志、成本、效果

两条典型链路

企业知识问答

用户提问

-> 权限校验

-> 意图识别

-> RAG 检索文档

-> 重排

-> LLM 生成答案

-> 引用来源

-> 审核/脱敏

-> 返回

这条链路通常不需要 Agent。

RAG + Workflow + Model 就够了。

复杂业务助手

比如："帮我分析这次测试失败原因，并通知负责人"

用户下达任务

-> Workflow 创建任务状态

-> Agent 拆解步骤

-> 调日志系统 / 测试平台 / Git / 知识库

-> RAG 查历史故障和 runbook

-> 模型分析归因

-> Workflow 判断是否需要人工确认

-> 发送通知 / 创建工单

-> 记录结果

这条链路里，Agent 才有价值。

建议你这样理解职责边界

Workflow

负责"流程必须怎么走"

Agent

负责"这件事怎么做出来"

负责"去哪里找企业知识"

Model

负责"怎么理解和生成"

Skill/Tool

负责"真正去执行动作"

企业级一定要补上的横向能力

如果没有下面这些，就不算完整企业架构：

权限

不同用户只能看到自己有权看的知识和数据

审计

记录谁问了什么、系统用了什么资料、执行了什么动作

观测

看得见每一步耗时、token、失败点、工具调用链路

评测

不只是"能回答"，还要看正确率、幻觉率、命中率、人工满意度

安全

脱敏、提示注入防护、越权访问防护、内容安全

成本治理

简单任务走小模型，复杂任务走大模型，检索先于生成

一个很实用的落地原则

企业系统里，通常应该是：

80% 用 Workflow + RAG + Rules
20% 再让 Agent 出场

因为大多数企业任务本质上是流程化的，不是完全开放式问题。

如果你要落地，我建议的默认技术形态

主干：Workflow
知识问答：RAG + LLM
复杂操作节点：Agent
外部能力接入：Skill / Tools
风险控制：Rules + HITL
生产治理：Observability + Eval + Security

一句总结

企业 AI 架构不是"把一个大模型接上去"就完了，而是：

用 Workflow 保证可控，用 RAG 接入企业知识，用 Agent 处理复杂任务，用模型提供智能，用治理层保证它能长期上线运行。