AI大模型应用开发-智能体架构

一、智能体架构

一般应用系统中的智能体架构有6种,分别是:

  • 增强型智能体。
  • 链式工作流智能体。
  • 路由工作流智能体。
  • 并行工作流智能体。
  • 协调器工作流智能体。
  • 评估优化工作流智能体。

1.1 增强型智能体

增强型智能体的基本构建块是一个增强的LLM,其中包含检索、工具和记忆等增强功能。

  • 输入输出系统:整个流程是线性的,就是从输入到大模型(LLM),再到输出。简单来说,就是 Input → LLM → Output。
  • 大模型(LLM):它就像个中央处理器,负责协调三个主要的功能模块------检索(Retrieval)、工具(Tools)和记忆(Memory),一起来完成信息处理。
  • 这种模型,适用于业务不是很复杂的场景。

1.2 链式工作流智能体

工作流智能体模式,就是将任务分解为一系列步骤,其中每个LLM调用处理上一个步骤的输出,通过多步骤LLM调用分阶段处理复杂任务。

  • **顺序分解:**将任务拆解为 LLM Call 1LLM Call 2LLM Call 3 的固定步骤链。
  • **中间检查(Gate):**在第一步输出后插入 Gate 决策点,实现中间验证阻断错误传播。
  • 上下文传递:Output 1 作为 LLM Call 2 的输入,Output 2 作为 LLM Call 3 的输入,通过链式传递上下文保持任务连贯性。

这种模式适用于任务比较复杂,但处理流程固定的场景
比如:写文章 → 生成大纲 → 校验大纲 → 依据大纲编写内容 → 对内容校验 → 最后输出。

1.3 路由工作流智能体

路由工作流智能体,这种模式是将输入通过 LLM Call Router 对意图识别,再交由下游的 LLM 执行。

  • 动态路径选择:Router 节点根据输入特征(如内容类型、用户意图)决定调用哪个LLM。
  • 集中式决策:所有输入需先经过Router(而非直接调用LLM),使用路由控制器降低业务系统之间的耦合度。
  • 可扩展性:图中预设3个LLM调用路径,实际上,可扩展更多分支,也就是说,路由模式可以灵活的增减处理模块,比较灵活。

这种模式适用于复杂业务,并且后续的处理逻辑比较独立的场景。

比如:AI助理,推荐课程、查询课程、购买课程,这都是独立的业务,可以用独立的智能体实现。

1.4 并行工作流智能体

并行工作智能体,是指一个输入同时交给多个LLM去执行,再将这些大模型的输出进行汇总处理,再输出。

  • 任务并行拆分 :输入(In)同时分发给 LLM Call 1/2/3 并行处理,通过并发执行独立子任务提升效率。
  • 结果聚合策略 :通过 Aggregator 模块整合多个LLM输出,用冗余计算换取结果可靠性。
  • 模块化隔离:各LLM节点无直接依赖关系(仅通过Aggregator连接),降低单点故障风险的容错设计。

这种模式,一般会在两种场景中使用:

  • 将一个任务,拆分成多个子任务,并行执行,提升效率。

  • 例如:需要开发一个多维度内容审核系统,包括:是否含攻击性言论、关键数据是否准确、是否引用未授权内容等检测,这些检测可以并行执行,提升系统效率。

  • 将同一个任务,由不同的大模型执行多次,得到不同的输出,再聚合处理,以得到更准确的结果。

  • 例如:如医疗诊断辅助、金融风险评估。

1.5 协调器工作流智能体

协调器工作流智能体,这种模式是,由Orchestrator LLM作为智能调度中心,动态生成 子任务列表,子任务可以是并行或串行执行,结果由Synthesizer进行聚合输出。

  • 动态任务分解:Orchestrator 担任智能调度的核心角色,能够利用大型语言模型(LLM)动态地生成子任务列表。
  • 异构模型协同工作:通过并行或串行方式调用多个大型语言模型,并依据各个子任务的具体需求选择最适合的模型执行,以此实现高效的资源分配策略。
  • 结果智能化整合:Synthesizer 采用语义融合技术,确保来自不同模型的结果在最终输出时达到高度的一致性和连贯性。

这种工作流程适合处理复杂且细节不确定的任务(如编程时根据实际情况修改文件)。它看起来像并行处理,但更灵活:任务不是预先定义好的,而是由协调器根据进展动态分配和调整。

1.6 评估优化工作流智能体

评估优化工作流智能体,是这一种 生成 → 评估 → 反馈 循环反馈的机制。

  • 生成阶段(Generator):产生初始解决方案(Solution)
  • 评估阶段(Evaluator):验证输出质量,可以选择Accepted(认可)或 Rejected+Feedback(拒绝+反馈)。
  • 决策阶段:根据评估结果选择终结输出或重新生成。

场景:

  • 在文学翻译领域,译者型语言模型(LLM)可能在初次尝试时未能完全把握文本中的细微差异,但评估型语言模型(LLM)能够对此提供具有建设性的反馈。
  • 在执行复杂的搜索任务时,往往需要通过多轮的搜索与分析来确保信息收集的全面性。在此过程中,评估者将根据已获取的信息质量及完整性,判断是否有必要展开进一步的搜索活动。

1.7 总结

模式名称 控制方式 延迟水平 可靠性 典型应用场景 开发复杂度
增强型智能体 直接输出 最低 简单问答、内容润色 简单
链式工作流智能体 线性顺序执行 中等 中高 分阶段任务(如大纲→内容→格式优化) 中等
路由工作流智能体 条件分支选择 低-中等 多领域处理(如客服分流转人工) 中等
并行工作流智能体 多模型并发执行 中等 可靠性敏感任务(如医疗诊断辅助) 较高
协调器工作流智能体 动态任务分解+调度 最高 复杂业务(如商业智能分析系统) 极高
评估优化工作流智能体 迭代优化+反馈修正 最高 极高 质量敏感场景(如法律文件生成)

模式选型建议,根据业务需求选择:

  • 简单任务 → 增强型智能体 / 链式工作流智能体。
  • 多分支处理 → 路由模式。
  • 高实时性 → 并行化(需任务可拆分)。
  • 超复杂任务 → 协调器工作流智能体。
  • 超高可靠性 → 评估优化工作流智能体。

路由智能体,多智能体协调工作。

相关推荐
FeelTouch Labs2 小时前
企业落地AI数据分析项目DB-GPT、Supersonic和SQLcoder
人工智能·数据分析·智能问数
生活予甜2 小时前
2026年算法备案办理服务优选服务商口碑解读
大数据·运维·人工智能
SCBAiotAigc2 小时前
2026.3.7:具身智能之51单片机<二>:ISP烧录过程
c++·人工智能·单片机·嵌入式硬件·51单片机·c
Sunhen_Qiletian2 小时前
计算机视觉系列进阶教学之人脸检测
人工智能·计算机视觉
掘金一周2 小时前
为什么我拖了一个多月才开始使用OpenClaw?| 掘金一周 3.12
人工智能
Galerkin码农选手2 小时前
per_tenor_quant_fp8和per_token_quant_fp8算法解读
人工智能·pytorch·算法
AI-小柒2 小时前
OpenClaw技术深度解析:从智能助手到自动化引擎的范式革命(附DataEyes实战)
大数据·运维·开发语言·人工智能·python·http·自动化
小白自救计划3 小时前
【计算机视觉】学习历程
人工智能·学习·计算机视觉
无人装备硬件开发爱好者3 小时前
Lockhart-Martinelli(L-M)模型原理、历史由来与嵌入式边缘计算工程化落地(附 MATLAB 伪代码)——1
人工智能