AI大模型应用开发-智能体架构

一般应用系统中的智能体架构有6种，分别是：

增强型智能体的基本构建块是一个增强的LLM，其中包含检索、工具和记忆等增强功能。

输入输出系统：整个流程是线性的，就是从输入到大模型（LLM），再到输出。简单来说，就是 Input → LLM → Output。
大模型（LLM）：它就像个中央处理器，负责协调三个主要的功能模块------检索（Retrieval）、工具（Tools）和记忆（Memory），一起来完成信息处理。
这种模型，适用于业务不是很复杂的场景。

工作流智能体模式，就是将任务分解为一系列步骤，其中每个LLM调用处理上一个步骤的输出，通过多步骤LLM调用分阶段处理复杂任务。

**顺序分解：**将任务拆解为 LLM Call 1 → LLM Call 2 → LLM Call 3 的固定步骤链。
**中间检查（Gate）：**在第一步输出后插入 Gate 决策点，实现中间验证阻断错误传播。
上下文传递：Output 1 作为 LLM Call 2 的输入，Output 2 作为 LLM Call 3 的输入，通过链式传递上下文保持任务连贯性。

这种模式适用于任务比较复杂，但处理流程固定的场景
比如：写文章 → 生成大纲 → 校验大纲 → 依据大纲编写内容 → 对内容校验 → 最后输出。

路由工作流智能体，这种模式是将输入通过 LLM Call Router 对意图识别，再交由下游的 LLM 执行。

这种模式适用于复杂业务，并且后续的处理逻辑比较独立的场景。

比如：AI助理，推荐课程、查询课程、购买课程，这都是独立的业务，可以用独立的智能体实现。

并行工作智能体，是指一个输入同时交给多个LLM去执行，再将这些大模型的输出进行汇总处理，再输出。

这种模式，一般会在两种场景中使用：

协调器工作流智能体，这种模式是，由Orchestrator LLM作为智能调度中心，动态生成 子任务列表，子任务可以是并行或串行执行，结果由Synthesizer进行聚合输出。

这种工作流程适合处理复杂且细节不确定的任务（如编程时根据实际情况修改文件）。它看起来像并行处理，但更灵活：任务不是预先定义好的，而是由协调器根据进展动态分配和调整。

评估优化工作流智能体，是这一种生成 → 评估 → 反馈循环反馈的机制。

场景：

在文学翻译领域，译者型语言模型（LLM）可能在初次尝试时未能完全把握文本中的细微差异，但评估型语言模型（LLM）能够对此提供具有建设性的反馈。
在执行复杂的搜索任务时，往往需要通过多轮的搜索与分析来确保信息收集的全面性。在此过程中，评估者将根据已获取的信息质量及完整性，判断是否有必要展开进一步的搜索活动。

模式名称	控制方式	延迟水平	可靠性	典型应用场景	开发复杂度
增强型智能体	直接输出	最低	低	简单问答、内容润色	简单
链式工作流智能体	线性顺序执行	中等	中高	分阶段任务（如大纲→内容→格式优化）	中等
路由工作流智能体	条件分支选择	低-中等	中	多领域处理（如客服分流转人工）	中等
并行工作流智能体	多模型并发执行	中等	高	可靠性敏感任务（如医疗诊断辅助）	较高
协调器工作流智能体	动态任务分解+调度	高	最高	复杂业务（如商业智能分析系统）	极高
评估优化工作流智能体	迭代优化+反馈修正	最高	极高	质量敏感场景（如法律文件生成）	高

模式选型建议，根据业务需求选择：

路由智能体，多智能体协调工作。