Reflection Agent
介绍
agent不能纠错,是否能重新弄一个专属agent配套纠错信息,进行纠错呢
是在 Agent 执行过程中加入**自我评估(Self-Evaluation)→ 自我修正(Self-Reflection)→ 再执行(Retry)**能力。
一、Reflection Agent 是什么
Reflection Agent = 会"检查自己答案"的 Agent。
用户
│
▼
Planner
│
▼
Executor
│
▼
初始答案
│
▼
Reflection(反思)
│
├──正确?
├──遗漏?
├──逻辑?
├──格式?
│
▼
修改
│
▼
最终答案
LLM 自己充当 Reviewer(代码审查员)。
二、为什么会出现 Reflection
GPT-4、Claude、Gemini 都开始大量采用:
Draft
↓
Critic
↓
Rewrite
↓
Final
LLM 推理能力有限 VS 高质量结果要求。生成速度 VS 输出质量
复杂任务需要不断修正 VS LLM 没有自检能力
Reflection:考试
↓
检查试卷
↓
修改
↓
再交
SQL 有问题↓
重新生成 SQL
↓
继续
三 .流程

四 Reflection 做什么

Reflection 有哪些研究方向
| 方向 | 做什么 | 解决问题 |
|---|---|---|
| Self Reflection | 自己评价自己 | 输出质量 |
| Critic Agent | 单独 Reviewer | 多 Agent 协作 |
| Retry Reflection | 自动重试 | 工具失败 |
| Verification | 验证事实 | 幻觉 |
| Reflection Memory | 记录失败经验 | 长期优化 |
| Error Recovery | 自动恢复 | Agent 崩溃 |
| Constitutional Reflection | 按规则检查 | 安全 |
Reflection 常见架构

现有技术栈
| 框架 | Reflection支持 | 成熟度 |
|---|---|---|
| LangGraph | ⭐⭐⭐⭐⭐ | 非常成熟 |
| AutoGen | ⭐⭐⭐⭐ | 成熟 |
| CrewAI | ⭐⭐⭐⭐ | 成熟 |
| OpenAI Agents SDK | ⭐⭐⭐⭐ | 成熟 |
| LlamaIndex | ⭐⭐⭐ | 支持 |
| 框架 | Reflection支持 | 推荐指数 |
|---|---|---|
| Spring AI | ⭐⭐⭐(需自行编排) | ⭐⭐⭐⭐⭐ |
| LangChain4j | ⭐⭐⭐(可实现反思循环) | ⭐⭐⭐⭐ |
| Spring AI Alibaba | ⭐⭐⭐(结合工作流) | ⭐⭐⭐⭐ |
| 基于工作流引擎(如 Flowable、Temporal) | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
Controller
│
▼
TaskService
│
▼
Planner
│
▼
Executor
│
▼
Tool Calling
│
▼
Draft
│
▼
ReflectionService
│
├── Score
├── Hallucination Check
├── Missing Check
├── Format Check
│
▼
Retry?
│
┌────┴─────┐
│ │
Yes No
│ │
▼ ▼
Executor Final
| 阶段 | 核心能力 | 解决的主要矛盾 |
|---|---|---|
| Tool Calling | 调用外部工具 | LLM 无法直接操作外部系统 |
| Workflow Agent | 多步骤流程编排 | 单次调用无法完成复杂业务流程 |
| Planning Agent | 任务规划与拆解 | 用户目标复杂,缺乏执行计划 |
| Memory Agent | 长短期记忆 | 上下文有限,无法持续积累经验 |
| Reflection Agent | 自我评估、自我修正 | 一次生成质量不足,缺乏自检能力 |
| Multi-Agent | 多角色协作 | 单 Agent 专业能力有限 |
| Autonomous Agent | 长时间自主执行 | 人工持续干预成本高 |
Autonomous Retrieval
Agent 不再按照固定 RAG 流程检索,而是能够自主决定"什么时候查、查哪里、查多少、是否继续查"。
检索变成 Agent 自己做决策。
为什么出现 Autonomous Retrieval
上上文,我们以对RAG进行优化-符合含义的情况下,命中更多rag

这里解决的是 不同问题,应该去不同地方。也可以理解为纠错机制

解决什么矛盾
固定检索流程 VS 用户问题来源多样化
有限上下文 VS 海量知识
不知道知识够不够 VS 需要高质量回答
Autonomous Retrieval 的能力

研究方向
| 方向 | 做什么 | 解决问题 |
|---|---|---|
| Adaptive Retrieval | 动态检索 | 固定TopK |
| Multi-source Retrieval | 多知识源 | 单一知识库 |
| Hybrid Retrieval | 稀疏+稠密 | Recall低 |
| Graph Retrieval | 图检索 | 关系问题 |
| Agentic RAG | Agent决定RAG | 固定Pipeline |
| Recursive Retrieval | 递归检索 | 信息不足 |
| Retrieval Planning | 检索规划 | 查哪里 |
| Self-Evaluated Retrieval | 检索后评分 | 判断是否继续 |
| Retrieval Memory | 学习历史检索 | 提升效率 |
现有技术栈
| 技术 | 用途 |
|---|---|
| Spring AI | Agent、Tool Calling、RAG |
| LangChain4j | 检索增强、Agent |
| Elasticsearch | BM25、Hybrid Search |
| Redis | Cache、Memory |
| Milvus | 向量检索 |
| Qdrant | 向量数据库 |
| Neo4j | Graph RAG |
| Apache Kafka | 检索事件流 |
| 技术 | 用途 |
|---|---|
| LangGraph | Agent 状态机 |
| LlamaIndex | Agentic Retrieval |
| Haystack | Hybrid Retrieval |
| AutoGen | 多 Agent 检索 |
| DSPy | 自动优化检索策略 |
企业级架构
User
│
Intent Recognition
│
Retrieval Planner
│
┌─────────────┼─────────────┐
│ │ │
Memory Vector DB SQL
│ │ │
├─────────────┼─────────────┤
│ │ │
Graph DB Web/API Elasticsearch
│
Result Evaluator
│
Enough? ────┴────── Retry
│
Context Builder
│
LLM
│
Final Answer
在 Agent 演进路线中的位置
| 阶段 | 核心能力 | 最大解决矛盾 |
|---|---|---|
| Tool Calling | 调用工具 | LLM 无法操作外部系统 |
| Workflow Agent | 多步骤编排 | 单次调用无法完成复杂流程 |
| Planning Agent | 任务规划 | 缺乏执行计划 |
| Memory Agent | 长短期记忆 | 上下文有限 |
| Reflection Agent | 自我评估 | 一次生成质量不足 |
| Autonomous Retrieval | 自主选择、规划和迭代检索 | 固定 RAG 流程无法适应多知识源和动态信息需求 |
| Multi-Agent | 多角色协同 | 单 Agent 能力边界 |
| Autonomous Agent | 长时间自主执行 | 人工持续参与成本高 |
Multi-Agent
Multi-Agent(多智能体)是 2026 年企业级 AI Agent 的核心方向之一。它不是把一个 Agent 做得越来越复杂,而是将任务拆分给多个具备不同职责的 Agent,通过协作完成复杂任务。
多个 AI Agent 像一个团队一样协同工作。

Multi-Agent:
用户
│
▼
Manager Agent
│
┌──────────┼──────────┐
▼ ▼ ▼
Planner Backend Frontend
Agent Agent Agent
│ │ │
▼ ▼ ▼
Database Test Agent DevOps Agent
为什么出现 Multi-Agent
因为单 Agent 有明显瓶颈。
开发商城系统。需要
需求分析
↓
数据库设计
↓
Java开发
↓
Vue开发
↓
测试
↓
部署
一个 Agent:
全部自己完成
容易:
- 遗漏模块
- 上下文过长
- 推理混乱
- 角色冲突
所以:拆成多个 Agent。
Multi-Agent 最大解决什么矛盾

Multi-Agent 的组成
常见协作模式
Manager-Worker
Manager
┌─────┼─────┐
▼ ▼ ▼
Agent1 Agent2 Agent3
Pipeline
Planner
↓
Developer
↓
Tester
↓
Reviewer
Peer-to-Peer
AgentA ←→ AgentB
↑ ↓
AgentC ←→ AgentD
彼此协作。
没有中心。
Hierarchical
CEO
↓
Manager
↓
Leader
↓
Developer
企业组织。
Blackboard
共享Memory
↑ ↑ ↑
A B C
研究方向
| 方向 | 做什么 | 解决问题 |
|---|---|---|
| Role-based Agent | 角色分工 | 专业化 |
| Hierarchical Agent | 分层管理 | 大规模任务 |
| Debate Agent | 多Agent辩论 | 提高正确率 |
| Cooperative Agent | 协作 | 分工 |
| Competitive Agent | 竞争 | 选择最佳答案 |
| Swarm Agent | 群体智能 | 超大规模协同 |
| Blackboard Agent | 共享记忆 | 信息同步 |
| Agent Communication | 通信协议 | 数据交换 |
现有技术栈
| 技术 | 用途 |
|---|---|
| Spring AI | Agent、Prompt、Tool Calling |
| LangChain4j | 多 Agent 编排 |
| Spring AI Alibaba | 企业级 Agent 集成 |
| Redis | Agent 状态共享 |
| Apache Kafka / RabbitMQ | Agent 间消息通信 |
| 工作流引擎(Flowable、Temporal) | 长流程、多 Agent 调度 |
| 技术 | 用途 |
|---|---|
| LangGraph | 多 Agent 状态图 |
| AutoGen | 多 Agent 对话 |
| CrewAI | 角色协作 |
| OpenAI Agents SDK | Agent 编排 |
| Semantic Kernel | 企业级 Agent |
企业级架构
User
│
Manager Agent
│
┌────────────────┼────────────────┐
▼ ▼ ▼
Planner Agent Retrieval Agent Memory Agent
│ │ │
└────────────────┼────────────────┘
▼
Task Scheduler
│
┌───────────┬───────────┬───────────┐
▼ ▼ ▼
Backend Frontend Database
Agent Agent Agent
│ │ │
└───────────┼───────────┘
▼
Review Agent
▼
Reflection Agent
▼
Final Answer
Java 企业级落地示例
| Agent | 职责 | 技术栈 |
|---|---|---|
| Manager Agent | 接收需求、拆分任务 | Spring AI |
| Planner Agent | 制定开发计划 | Spring AI + Workflow |
| Backend Agent | Controller、Service、Redis、MQ | Spring Boot |
| Database Agent | MySQL、DDL、索引优化 | MyBatis-Plus |
| Frontend Agent | Vue3、TypeScript、Element Plus | Vue |
| RAG Agent | 查询企业知识库 | Milvus / Elasticsearch |
| Reflection Agent | 审查生成代码、修复问题 | Spring AI |
| Test Agent | JUnit、接口测试、性能测试 | JUnit、Postman |
| DevOps Agent | Docker、CI/CD、Kubernetes | Docker、K8s |
在 Agent 技术演进中的位置
| 阶段 | 核心能力 | 最大解决矛盾 |
|---|---|---|
| Tool Calling | 调用外部工具 | LLM 无法直接操作外部系统 |
| Workflow Agent | 多步骤执行 | 单次调用无法完成复杂流程 |
| Planning Agent | 任务规划 | 缺乏执行计划 |
| Memory Agent | 长短期记忆 | 上下文有限、经验无法沉淀 |
| Reflection Agent | 自我评估 | 一次生成质量不足 |
| Autonomous Retrieval | 自主规划检索 | 固定 RAG 无法适应动态知识源 |
| Multi-Agent | 多角色协同与专业分工 | 复杂业务需要多领域协作,单 Agent 难以兼顾所有能力 |
| Autonomous Agent | 长时间自主执行 | 人工持续介入成本高 |
从工程角度看,Multi-Agent 更像是企业级 Agent 的总体架构模式,而不是单一能力模块。它将规划、检索、记忆、反思和工具调用组织成一个可扩展、可协作的智能系统,这也是当前大型企业 AI 应用平台的主流发展方向。
MCP Agen
对于企业 Java 开发者而言,MCP 的意义类似于 JDBC 对数据库的意义:
- JDBC:统一访问 MySQL、PostgreSQL、Oracle 等数据库。
- MCP:统一访问 GitHub、数据库、文件系统、知识库、办公平台等各种 AI 工具与资源。

AI Agent 需要连接越来越多外部系统,而每个系统接口都不同、集成成本越来越高之间的矛盾。
传统 Agent:
Agent
│
▼
MCP Client
│
──────────────────MCP──────────────────
│ │ │
▼ ▼ ▼
GitHub PostgreSQL Filesystem
MCP Server MCP Server MCP Server
Agent:只认识:
MCP
不用关心:GitHub API。也不用关心:MySQL JDBC。
为什么出现 MCP

工作流程

mcp能力

探究方向
| 方向 | 做什么 | 解决问题 |
|---|---|---|
| MCP Tool | 工具标准化 | Tool接口混乱 |
| MCP Resource | 数据共享 | 文件访问 |
| MCP Prompt | Prompt共享 | Prompt复用 |
| MCP Memory | Memory共享 | Agent共享知识 |
| MCP Multi-Agent | Agent互联 | 多Agent协作 |
| MCP Marketplace | 工具市场 | 插件生态 |
| MCP Security | 权限控制 | 企业安全 |
| MCP Gateway | 企业网关 | 大规模接入 |
| 技术 | 用途 |
|---|---|
| Spring AI | MCP Client、Agent、Tool Calling |
| Spring AI Alibaba | 企业 AI 集成 |
| LangChain4j | Agent 编排,可集成 MCP |
| Model Context Protocol Java SDK | 开发 MCP Client / Server |
| Redis | 状态缓存 |
| Apache Kafka | Agent 消息流 |
| 技术 | 用途 |
|---|---|
| Model Context Protocol Python SDK | MCP Server |
| LangGraph | Agent 状态管理 |
| OpenAI Agents SDK | 支持 MCP 集成 |
| FastMCP | 快速开发 MCP Server |
对比
| 对比项 | 传统 Tool Calling | MCP Agent |
|---|---|---|
| 接口规范 | 每个工具独立定义 | 统一 MCP 协议 |
| 工具扩展 | 新工具需重新开发适配 | 新增 MCP Server 即可 |
| 耦合程度 | Agent 与工具强耦合 | Agent 与协议耦合、与工具解耦 |
| 生态复用 | 较弱 | 强,可复用已有 MCP Server |
| 企业集成 | 成本随工具数量增长 | 更适合大规模工具生态 |
阶段
| 阶段 | 核心能力 | 最大解决矛盾 |
|---|---|---|
| Tool Calling | 调用外部工具 | LLM 无法操作外部系统 |
| Workflow Agent | 多步骤流程 | 复杂任务编排 |
| Planning Agent | 任务规划 | 缺乏执行计划 |
| Memory Agent | 长短期记忆 | 上下文有限 |
| Reflection Agent | 自我评估 | 输出质量不足 |
| Autonomous Retrieval | 自主检索 | 固定 RAG 流程 |
| Multi-Agent | 多角色协作 | 单 Agent 能力有限 |
| MCP Agent | 基于统一协议连接工具与数据 | 工具生态碎片化、集成成本高 |
| Autonomous Agent | 长时间自主执行 | 人工持续参与成本高 |
Autonomous Agent
Autonomous Agent(自主智能体)代表 Agent 技术发展的最高阶段之一。它不仅能够调用工具、规划任务、检索知识或反思结果,还能够在较长时间内自主完成目标,并根据环境变化持续调整自己的行为。

解决矛盾

Autonomous Agent 的核心能力
| 能力 | 作用 |
|---|---|
| Goal(目标管理) | 持续围绕目标执行 |
| Planning(规划) | 制定长期计划 |
| Workflow(执行) | 多步骤执行 |
| Tool Calling | 操作外部系统 |
| Autonomous Retrieval | 自主检索知识 |
| Memory | 保存长期状态 |
| Reflection | 自我修正 |
| Multi-Agent | 调用其他 Agent |
| Monitoring | 监控执行状态 |
| Replanning | 动态重新规划 |
所有 Agent 技术的综合体。
工作流程

生命周期

研究方向
| 方向 | 做什么 | 解决问题 |
|---|---|---|
| Long-running Agent | 长时间运行 | 长任务 |
| Goal-oriented Agent | 目标驱动 | 任务管理 |
| Self-Evolving Agent | 自我优化 | 持续成长 |
| Self-Healing Agent | 自动恢复 | 系统故障 |
| Adaptive Planning | 动态规划 | 环境变化 |
| Autonomous Coding | 自主开发软件 | 软件工程 |
| Autonomous Research | 自动科研 | 文献分析 |
| Autonomous Operations | 自动运维 | 企业运维 |
| Digital Employee | 数字员工 | 企业办公 |
与前面所有 Agent 的关系
Goal
│
Planning
│
Workflow
│
Autonomous Retrieval
│
Tool Calling
│
MCP
│
Memory
│
Reflection
│
Multi-Agent
│
Monitor & Replan
│
Goal Completed
