AI应用工程师 03

Reflection Agent

介绍

agent不能纠错,是否能重新弄一个专属agent配套纠错信息,进行纠错呢

是在 Agent 执行过程中加入**自我评估(Self-Evaluation)→ 自我修正(Self-Reflection)→ 再执行(Retry)**能力。

一、Reflection Agent 是什么

Reflection Agent = 会"检查自己答案"的 Agent。

用户

Planner

Executor

初始答案

Reflection(反思)

├──正确?

├──遗漏?

├──逻辑?

├──格式?

修改

最终答案

LLM 自己充当 Reviewer(代码审查员)。

二、为什么会出现 Reflection

GPT-4、Claude、Gemini 都开始大量采用:

Draft

Critic

Rewrite

Final
LLM 推理能力有限 VS 高质量结果要求。

生成速度 VS 输出质量

复杂任务需要不断修正 VS LLM 没有自检能力
Reflection:

考试

检查试卷

修改

再交
SQL 有问题

重新生成 SQL

继续

三 .流程
四 Reflection 做什么
Reflection 有哪些研究方向
方向 做什么 解决问题
Self Reflection 自己评价自己 输出质量
Critic Agent 单独 Reviewer 多 Agent 协作
Retry Reflection 自动重试 工具失败
Verification 验证事实 幻觉
Reflection Memory 记录失败经验 长期优化
Error Recovery 自动恢复 Agent 崩溃
Constitutional Reflection 按规则检查 安全
Reflection 常见架构
现有技术栈
框架 Reflection支持 成熟度
LangGraph ⭐⭐⭐⭐⭐ 非常成熟
AutoGen ⭐⭐⭐⭐ 成熟
CrewAI ⭐⭐⭐⭐ 成熟
OpenAI Agents SDK ⭐⭐⭐⭐ 成熟
LlamaIndex ⭐⭐⭐ 支持
框架 Reflection支持 推荐指数
Spring AI ⭐⭐⭐(需自行编排) ⭐⭐⭐⭐⭐
LangChain4j ⭐⭐⭐(可实现反思循环) ⭐⭐⭐⭐
Spring AI Alibaba ⭐⭐⭐(结合工作流) ⭐⭐⭐⭐
基于工作流引擎(如 Flowable、Temporal) ⭐⭐⭐⭐ ⭐⭐⭐⭐

Controller

TaskService

Planner

Executor

Tool Calling

Draft

ReflectionService

├── Score

├── Hallucination Check

├── Missing Check

├── Format Check

Retry?

┌────┴─────┐

│ │

Yes No

│ │

▼ ▼

Executor Final

阶段 核心能力 解决的主要矛盾
Tool Calling 调用外部工具 LLM 无法直接操作外部系统
Workflow Agent 多步骤流程编排 单次调用无法完成复杂业务流程
Planning Agent 任务规划与拆解 用户目标复杂,缺乏执行计划
Memory Agent 长短期记忆 上下文有限,无法持续积累经验
Reflection Agent 自我评估、自我修正 一次生成质量不足,缺乏自检能力
Multi-Agent 多角色协作 单 Agent 专业能力有限
Autonomous Agent 长时间自主执行 人工持续干预成本高

Autonomous Retrieval

Agent 不再按照固定 RAG 流程检索,而是能够自主决定"什么时候查、查哪里、查多少、是否继续查"。

检索变成 Agent 自己做决策。

为什么出现 Autonomous Retrieval

上上文,我们以对RAG进行优化-符合含义的情况下,命中更多rag

这里解决的是 不同问题,应该去不同地方。也可以理解为纠错机制

解决什么矛盾

固定检索流程 VS 用户问题来源多样化

有限上下文 VS 海量知识

不知道知识够不够 VS 需要高质量回答

Autonomous Retrieval 的能力
研究方向
方向 做什么 解决问题
Adaptive Retrieval 动态检索 固定TopK
Multi-source Retrieval 多知识源 单一知识库
Hybrid Retrieval 稀疏+稠密 Recall低
Graph Retrieval 图检索 关系问题
Agentic RAG Agent决定RAG 固定Pipeline
Recursive Retrieval 递归检索 信息不足
Retrieval Planning 检索规划 查哪里
Self-Evaluated Retrieval 检索后评分 判断是否继续
Retrieval Memory 学习历史检索 提升效率
现有技术栈
技术 用途
Spring AI Agent、Tool Calling、RAG
LangChain4j 检索增强、Agent
Elasticsearch BM25、Hybrid Search
Redis Cache、Memory
Milvus 向量检索
Qdrant 向量数据库
Neo4j Graph RAG
Apache Kafka 检索事件流
技术 用途
LangGraph Agent 状态机
LlamaIndex Agentic Retrieval
Haystack Hybrid Retrieval
AutoGen 多 Agent 检索
DSPy 自动优化检索策略
企业级架构

User

Intent Recognition

Retrieval Planner

┌─────────────┼─────────────┐

│ │ │

Memory Vector DB SQL

│ │ │

├─────────────┼─────────────┤

│ │ │

Graph DB Web/API Elasticsearch

Result Evaluator

Enough? ────┴────── Retry

Context Builder

LLM

Final Answer

在 Agent 演进路线中的位置
阶段 核心能力 最大解决矛盾
Tool Calling 调用工具 LLM 无法操作外部系统
Workflow Agent 多步骤编排 单次调用无法完成复杂流程
Planning Agent 任务规划 缺乏执行计划
Memory Agent 长短期记忆 上下文有限
Reflection Agent 自我评估 一次生成质量不足
Autonomous Retrieval 自主选择、规划和迭代检索 固定 RAG 流程无法适应多知识源和动态信息需求
Multi-Agent 多角色协同 单 Agent 能力边界
Autonomous Agent 长时间自主执行 人工持续参与成本高

Multi-Agent

Multi-Agent(多智能体)是 2026 年企业级 AI Agent 的核心方向之一。它不是把一个 Agent 做得越来越复杂,而是将任务拆分给多个具备不同职责的 Agent,通过协作完成复杂任务。

多个 AI Agent 像一个团队一样协同工作。

Multi-Agent:

复制代码
               用户
                 │
                 ▼
          Manager Agent
                 │
      ┌──────────┼──────────┐
      ▼          ▼          ▼
Planner     Backend     Frontend
 Agent        Agent        Agent
      │          │          │
      ▼          ▼          ▼
 Database   Test Agent   DevOps Agent
为什么出现 Multi-Agent

因为单 Agent 有明显瓶颈。

开发商城系统。需要

复制代码
需求分析

↓

数据库设计

↓

Java开发

↓

Vue开发

↓

测试

↓

部署

一个 Agent:

复制代码
全部自己完成

容易:

  • 遗漏模块
  • 上下文过长
  • 推理混乱
  • 角色冲突

所以:拆成多个 Agent。

Multi-Agent 最大解决什么矛盾
Multi-Agent 的组成
常见协作模式

Manager-Worker

Manager

┌─────┼─────┐

▼ ▼ ▼

Agent1 Agent2 Agent3

Pipeline

Planner

Developer

Tester

Reviewer

Peer-to-Peer

AgentA ←→ AgentB

↑ ↓

AgentC ←→ AgentD

彼此协作。

没有中心。

Hierarchical

CEO

Manager

Leader

Developer

企业组织。

Blackboard

共享Memory

↑ ↑ ↑

A B C

研究方向

方向 做什么 解决问题
Role-based Agent 角色分工 专业化
Hierarchical Agent 分层管理 大规模任务
Debate Agent 多Agent辩论 提高正确率
Cooperative Agent 协作 分工
Competitive Agent 竞争 选择最佳答案
Swarm Agent 群体智能 超大规模协同
Blackboard Agent 共享记忆 信息同步
Agent Communication 通信协议 数据交换

现有技术栈

技术 用途
Spring AI Agent、Prompt、Tool Calling
LangChain4j 多 Agent 编排
Spring AI Alibaba 企业级 Agent 集成
Redis Agent 状态共享
Apache Kafka / RabbitMQ Agent 间消息通信
工作流引擎(Flowable、Temporal) 长流程、多 Agent 调度
技术 用途
LangGraph 多 Agent 状态图
AutoGen 多 Agent 对话
CrewAI 角色协作
OpenAI Agents SDK Agent 编排
Semantic Kernel 企业级 Agent

企业级架构

User

Manager Agent

┌────────────────┼────────────────┐

▼ ▼ ▼

Planner Agent Retrieval Agent Memory Agent

│ │ │

└────────────────┼────────────────┘

Task Scheduler

┌───────────┬───────────┬───────────┐

▼ ▼ ▼

Backend Frontend Database

Agent Agent Agent

│ │ │

└───────────┼───────────┘

Review Agent

Reflection Agent

Final Answer

Java 企业级落地示例

Agent 职责 技术栈
Manager Agent 接收需求、拆分任务 Spring AI
Planner Agent 制定开发计划 Spring AI + Workflow
Backend Agent Controller、Service、Redis、MQ Spring Boot
Database Agent MySQL、DDL、索引优化 MyBatis-Plus
Frontend Agent Vue3、TypeScript、Element Plus Vue
RAG Agent 查询企业知识库 Milvus / Elasticsearch
Reflection Agent 审查生成代码、修复问题 Spring AI
Test Agent JUnit、接口测试、性能测试 JUnit、Postman
DevOps Agent Docker、CI/CD、Kubernetes Docker、K8s

在 Agent 技术演进中的位置

阶段 核心能力 最大解决矛盾
Tool Calling 调用外部工具 LLM 无法直接操作外部系统
Workflow Agent 多步骤执行 单次调用无法完成复杂流程
Planning Agent 任务规划 缺乏执行计划
Memory Agent 长短期记忆 上下文有限、经验无法沉淀
Reflection Agent 自我评估 一次生成质量不足
Autonomous Retrieval 自主规划检索 固定 RAG 无法适应动态知识源
Multi-Agent 多角色协同与专业分工 复杂业务需要多领域协作,单 Agent 难以兼顾所有能力
Autonomous Agent 长时间自主执行 人工持续介入成本高

从工程角度看,Multi-Agent 更像是企业级 Agent 的总体架构模式,而不是单一能力模块。它将规划、检索、记忆、反思和工具调用组织成一个可扩展、可协作的智能系统,这也是当前大型企业 AI 应用平台的主流发展方向。

MCP Agen

对于企业 Java 开发者而言,MCP 的意义类似于 JDBC 对数据库的意义:

  • JDBC:统一访问 MySQL、PostgreSQL、Oracle 等数据库。
  • MCP:统一访问 GitHub、数据库、文件系统、知识库、办公平台等各种 AI 工具与资源。

AI Agent 需要连接越来越多外部系统,而每个系统接口都不同、集成成本越来越高之间的矛盾。

传统 Agent:

Agent

MCP Client

──────────────────MCP──────────────────

│ │ │

▼ ▼ ▼

GitHub PostgreSQL Filesystem

MCP Server MCP Server MCP Server

Agent:只认识:

复制代码
MCP

不用关心:GitHub API。也不用关心:MySQL JDBC。

为什么出现 MCP
工作流程
mcp能力
探究方向
方向 做什么 解决问题
MCP Tool 工具标准化 Tool接口混乱
MCP Resource 数据共享 文件访问
MCP Prompt Prompt共享 Prompt复用
MCP Memory Memory共享 Agent共享知识
MCP Multi-Agent Agent互联 多Agent协作
MCP Marketplace 工具市场 插件生态
MCP Security 权限控制 企业安全
MCP Gateway 企业网关 大规模接入
技术 用途
Spring AI MCP Client、Agent、Tool Calling
Spring AI Alibaba 企业 AI 集成
LangChain4j Agent 编排,可集成 MCP
Model Context Protocol Java SDK 开发 MCP Client / Server
Redis 状态缓存
Apache Kafka Agent 消息流
技术 用途
Model Context Protocol Python SDK MCP Server
LangGraph Agent 状态管理
OpenAI Agents SDK 支持 MCP 集成
FastMCP 快速开发 MCP Server
对比
对比项 传统 Tool Calling MCP Agent
接口规范 每个工具独立定义 统一 MCP 协议
工具扩展 新工具需重新开发适配 新增 MCP Server 即可
耦合程度 Agent 与工具强耦合 Agent 与协议耦合、与工具解耦
生态复用 较弱 强,可复用已有 MCP Server
企业集成 成本随工具数量增长 更适合大规模工具生态
阶段
阶段 核心能力 最大解决矛盾
Tool Calling 调用外部工具 LLM 无法操作外部系统
Workflow Agent 多步骤流程 复杂任务编排
Planning Agent 任务规划 缺乏执行计划
Memory Agent 长短期记忆 上下文有限
Reflection Agent 自我评估 输出质量不足
Autonomous Retrieval 自主检索 固定 RAG 流程
Multi-Agent 多角色协作 单 Agent 能力有限
MCP Agent 基于统一协议连接工具与数据 工具生态碎片化、集成成本高
Autonomous Agent 长时间自主执行 人工持续参与成本高

Autonomous Agent

Autonomous Agent(自主智能体)代表 Agent 技术发展的最高阶段之一。它不仅能够调用工具、规划任务、检索知识或反思结果,还能够在较长时间内自主完成目标,并根据环境变化持续调整自己的行为

解决矛盾
Autonomous Agent 的核心能力
能力 作用
Goal(目标管理) 持续围绕目标执行
Planning(规划) 制定长期计划
Workflow(执行) 多步骤执行
Tool Calling 操作外部系统
Autonomous Retrieval 自主检索知识
Memory 保存长期状态
Reflection 自我修正
Multi-Agent 调用其他 Agent
Monitoring 监控执行状态
Replanning 动态重新规划

所有 Agent 技术的综合体。

工作流程
生命周期
研究方向
方向 做什么 解决问题
Long-running Agent 长时间运行 长任务
Goal-oriented Agent 目标驱动 任务管理
Self-Evolving Agent 自我优化 持续成长
Self-Healing Agent 自动恢复 系统故障
Adaptive Planning 动态规划 环境变化
Autonomous Coding 自主开发软件 软件工程
Autonomous Research 自动科研 文献分析
Autonomous Operations 自动运维 企业运维
Digital Employee 数字员工 企业办公
与前面所有 Agent 的关系

Goal

Planning

Workflow

Autonomous Retrieval

Tool Calling

MCP

Memory

Reflection

Multi-Agent

Monitor & Replan

Goal Completed