AI应用工程师 03

Reflection Agent

介绍

agent不能纠错，是否能重新弄一个专属agent配套纠错信息，进行纠错呢

是在 Agent 执行过程中加入**自我评估（Self-Evaluation）→ 自我修正（Self-Reflection）→ 再执行（Retry）**能力。

一、Reflection Agent 是什么

Reflection Agent = 会"检查自己答案"的 Agent。

用户

│

▼

Planner

│

▼

Executor

│

▼

初始答案

│

▼

Reflection（反思）

│

├──正确？

├──遗漏？

├──逻辑？

├──格式？

│

▼

修改

│

▼

最终答案

LLM 自己充当 Reviewer（代码审查员）。

二、为什么会出现 Reflection

GPT-4、Claude、Gemini 都开始大量采用：

Draft

↓

Critic

↓

Rewrite

↓

Final
LLM 推理能力有限 VS 高质量结果要求。

生成速度 VS 输出质量

复杂任务需要不断修正 VS LLM 没有自检能力
Reflection：

考试

↓

检查试卷

↓

修改

↓

再交
SQL 有问题

↓

重新生成 SQL

↓

继续

三 .流程

四 Reflection 做什么

Reflection 有哪些研究方向

方向	做什么	解决问题
Self Reflection	自己评价自己	输出质量
Critic Agent	单独 Reviewer	多 Agent 协作
Retry Reflection	自动重试	工具失败
Verification	验证事实	幻觉
Reflection Memory	记录失败经验	长期优化
Error Recovery	自动恢复	Agent 崩溃
Constitutional Reflection	按规则检查	安全

Reflection 常见架构

现有技术栈

框架	Reflection支持	成熟度
LangGraph	⭐⭐⭐⭐⭐	非常成熟
AutoGen	⭐⭐⭐⭐	成熟
CrewAI	⭐⭐⭐⭐	成熟
OpenAI Agents SDK	⭐⭐⭐⭐	成熟
LlamaIndex	⭐⭐⭐	支持

框架	Reflection支持	推荐指数
Spring AI	⭐⭐⭐（需自行编排）	⭐⭐⭐⭐⭐
LangChain4j	⭐⭐⭐（可实现反思循环）	⭐⭐⭐⭐
Spring AI Alibaba	⭐⭐⭐（结合工作流）	⭐⭐⭐⭐
基于工作流引擎（如 Flowable、Temporal）	⭐⭐⭐⭐	⭐⭐⭐⭐

Controller

│

▼

TaskService

│

▼

Planner

│

▼

Executor

│

▼

Tool Calling

│

▼

Draft

│

▼

ReflectionService

│

├── Score

├── Hallucination Check

├── Missing Check

├── Format Check

│

▼

Retry？

│

┌────┴─────┐

│ │

Yes No

│ │

▼ ▼

Executor Final

阶段	核心能力	解决的主要矛盾
Tool Calling	调用外部工具	LLM 无法直接操作外部系统
Workflow Agent	多步骤流程编排	单次调用无法完成复杂业务流程
Planning Agent	任务规划与拆解	用户目标复杂，缺乏执行计划
Memory Agent	长短期记忆	上下文有限，无法持续积累经验
Reflection Agent	自我评估、自我修正	一次生成质量不足，缺乏自检能力
Multi-Agent	多角色协作	单 Agent 专业能力有限
Autonomous Agent	长时间自主执行	人工持续干预成本高

Autonomous Retrieval

Agent 不再按照固定 RAG 流程检索，而是能够自主决定"什么时候查、查哪里、查多少、是否继续查"。

检索变成 Agent 自己做决策。

为什么出现 Autonomous Retrieval

上上文，我们以对RAG进行优化-符合含义的情况下，命中更多rag

这里解决的是不同问题，应该去不同地方。也可以理解为纠错机制

解决什么矛盾

固定检索流程 VS 用户问题来源多样化

有限上下文 VS 海量知识

不知道知识够不够 VS 需要高质量回答

Autonomous Retrieval 的能力

研究方向

方向	做什么	解决问题
Adaptive Retrieval	动态检索	固定TopK
Multi-source Retrieval	多知识源	单一知识库
Hybrid Retrieval	稀疏+稠密	Recall低
Graph Retrieval	图检索	关系问题
Agentic RAG	Agent决定RAG	固定Pipeline
Recursive Retrieval	递归检索	信息不足
Retrieval Planning	检索规划	查哪里
Self-Evaluated Retrieval	检索后评分	判断是否继续
Retrieval Memory	学习历史检索	提升效率

现有技术栈

技术	用途
Spring AI	Agent、Tool Calling、RAG
LangChain4j	检索增强、Agent
Elasticsearch	BM25、Hybrid Search
Redis	Cache、Memory
Milvus	向量检索
Qdrant	向量数据库
Neo4j	Graph RAG
Apache Kafka	检索事件流

技术	用途
LangGraph	Agent 状态机
LlamaIndex	Agentic Retrieval
Haystack	Hybrid Retrieval
AutoGen	多 Agent 检索
DSPy	自动优化检索策略

企业级架构

User

│

Intent Recognition

│

Retrieval Planner

│

┌─────────────┼─────────────┐

│ │ │

Memory Vector DB SQL

│ │ │

├─────────────┼─────────────┤

│ │ │

Graph DB Web/API Elasticsearch

│

Result Evaluator

│

Enough? ────┴────── Retry

│

Context Builder

│

LLM

│

Final Answer

在 Agent 演进路线中的位置

阶段	核心能力	最大解决矛盾
Tool Calling	调用工具	LLM 无法操作外部系统
Workflow Agent	多步骤编排	单次调用无法完成复杂流程
Planning Agent	任务规划	缺乏执行计划
Memory Agent	长短期记忆	上下文有限
Reflection Agent	自我评估	一次生成质量不足
Autonomous Retrieval	自主选择、规划和迭代检索	固定 RAG 流程无法适应多知识源和动态信息需求
Multi-Agent	多角色协同	单 Agent 能力边界
Autonomous Agent	长时间自主执行	人工持续参与成本高

Multi-Agent

Multi-Agent（多智能体）是 2026 年企业级 AI Agent 的核心方向之一。它不是把一个 Agent 做得越来越复杂，而是将任务拆分给多个具备不同职责的 Agent，通过协作完成复杂任务。

多个 AI Agent 像一个团队一样协同工作。

Multi-Agent：

复制代码

               用户
                 │
                 ▼
          Manager Agent
                 │
      ┌──────────┼──────────┐
      ▼          ▼          ▼
Planner     Backend     Frontend
 Agent        Agent        Agent
      │          │          │
      ▼          ▼          ▼
 Database   Test Agent   DevOps Agent

为什么出现 Multi-Agent

因为单 Agent 有明显瓶颈。

开发商城系统。需要

复制代码

需求分析

↓

数据库设计

↓

Java开发

↓

Vue开发

↓

测试

↓

部署

一个 Agent：

复制代码

全部自己完成

容易：

遗漏模块
上下文过长
推理混乱
角色冲突

所以：拆成多个 Agent。

Multi-Agent 最大解决什么矛盾

Multi-Agent 的组成

常见协作模式

Manager-Worker

Manager

┌─────┼─────┐

▼ ▼ ▼

Agent1 Agent2 Agent3

Pipeline

Planner

↓

Developer

↓

Tester

↓

Reviewer

Peer-to-Peer

AgentA ←→ AgentB

↑ ↓

AgentC ←→ AgentD

彼此协作。

没有中心。

Hierarchical

CEO

↓

Manager

↓

Leader

↓

Developer

企业组织。

Blackboard

共享Memory

↑ ↑ ↑

A B C

研究方向

方向	做什么	解决问题
Role-based Agent	角色分工	专业化
Hierarchical Agent	分层管理	大规模任务
Debate Agent	多Agent辩论	提高正确率
Cooperative Agent	协作	分工
Competitive Agent	竞争	选择最佳答案
Swarm Agent	群体智能	超大规模协同
Blackboard Agent	共享记忆	信息同步
Agent Communication	通信协议	数据交换

现有技术栈

技术	用途
Spring AI	Agent、Prompt、Tool Calling
LangChain4j	多 Agent 编排
Spring AI Alibaba	企业级 Agent 集成
Redis	Agent 状态共享
Apache Kafka / RabbitMQ	Agent 间消息通信
工作流引擎（Flowable、Temporal）	长流程、多 Agent 调度

技术	用途
LangGraph	多 Agent 状态图
AutoGen	多 Agent 对话
CrewAI	角色协作
OpenAI Agents SDK	Agent 编排
Semantic Kernel	企业级 Agent

企业级架构

User

│

Manager Agent

│

┌────────────────┼────────────────┐

▼ ▼ ▼

Planner Agent Retrieval Agent Memory Agent

│ │ │

└────────────────┼────────────────┘

▼

Task Scheduler

│

┌───────────┬───────────┬───────────┐

▼ ▼ ▼

Backend Frontend Database

Agent Agent Agent

│ │ │

└───────────┼───────────┘

▼

Review Agent

▼

Reflection Agent

▼

Final Answer

Java 企业级落地示例

Agent	职责	技术栈
Manager Agent	接收需求、拆分任务	Spring AI
Planner Agent	制定开发计划	Spring AI + Workflow
Backend Agent	Controller、Service、Redis、MQ	Spring Boot
Database Agent	MySQL、DDL、索引优化	MyBatis-Plus
Frontend Agent	Vue3、TypeScript、Element Plus	Vue
RAG Agent	查询企业知识库	Milvus / Elasticsearch
Reflection Agent	审查生成代码、修复问题	Spring AI
Test Agent	JUnit、接口测试、性能测试	JUnit、Postman
DevOps Agent	Docker、CI/CD、Kubernetes	Docker、K8s

在 Agent 技术演进中的位置

阶段	核心能力	最大解决矛盾
Tool Calling	调用外部工具	LLM 无法直接操作外部系统
Workflow Agent	多步骤执行	单次调用无法完成复杂流程
Planning Agent	任务规划	缺乏执行计划
Memory Agent	长短期记忆	上下文有限、经验无法沉淀
Reflection Agent	自我评估	一次生成质量不足
Autonomous Retrieval	自主规划检索	固定 RAG 无法适应动态知识源
Multi-Agent	多角色协同与专业分工	复杂业务需要多领域协作，单 Agent 难以兼顾所有能力
Autonomous Agent	长时间自主执行	人工持续介入成本高

从工程角度看，Multi-Agent 更像是企业级 Agent 的总体架构模式，而不是单一能力模块。它将规划、检索、记忆、反思和工具调用组织成一个可扩展、可协作的智能系统，这也是当前大型企业 AI 应用平台的主流发展方向。

MCP Agen

对于企业 Java 开发者而言，MCP 的意义类似于 JDBC 对数据库的意义：

JDBC：统一访问 MySQL、PostgreSQL、Oracle 等数据库。

MCP：统一访问 GitHub、数据库、文件系统、知识库、办公平台等各种 AI 工具与资源。

AI Agent 需要连接越来越多外部系统，而每个系统接口都不同、集成成本越来越高之间的矛盾。

传统 Agent：

Agent

│

▼

MCP Client

│

──────────────────MCP──────────────────

│ │ │

▼ ▼ ▼

GitHub PostgreSQL Filesystem

MCP Server MCP Server MCP Server

Agent：只认识：

复制代码

MCP

不用关心：GitHub API。也不用关心：MySQL JDBC。

为什么出现 MCP

工作流程

mcp能力

探究方向

方向	做什么	解决问题
MCP Tool	工具标准化	Tool接口混乱
MCP Resource	数据共享	文件访问
MCP Prompt	Prompt共享	Prompt复用
MCP Memory	Memory共享	Agent共享知识
MCP Multi-Agent	Agent互联	多Agent协作
MCP Marketplace	工具市场	插件生态
MCP Security	权限控制	企业安全
MCP Gateway	企业网关	大规模接入

技术	用途
Spring AI	MCP Client、Agent、Tool Calling
Spring AI Alibaba	企业 AI 集成
LangChain4j	Agent 编排，可集成 MCP
Model Context Protocol Java SDK	开发 MCP Client / Server
Redis	状态缓存
Apache Kafka	Agent 消息流

技术	用途
Model Context Protocol Python SDK	MCP Server
LangGraph	Agent 状态管理
OpenAI Agents SDK	支持 MCP 集成
FastMCP	快速开发 MCP Server

对比

对比项	传统 Tool Calling	MCP Agent
接口规范	每个工具独立定义	统一 MCP 协议
工具扩展	新工具需重新开发适配	新增 MCP Server 即可
耦合程度	Agent 与工具强耦合	Agent 与协议耦合、与工具解耦
生态复用	较弱	强，可复用已有 MCP Server
企业集成	成本随工具数量增长	更适合大规模工具生态

阶段

阶段	核心能力	最大解决矛盾
Tool Calling	调用外部工具	LLM 无法操作外部系统
Workflow Agent	多步骤流程	复杂任务编排
Planning Agent	任务规划	缺乏执行计划
Memory Agent	长短期记忆	上下文有限
Reflection Agent	自我评估	输出质量不足
Autonomous Retrieval	自主检索	固定 RAG 流程
Multi-Agent	多角色协作	单 Agent 能力有限
MCP Agent	基于统一协议连接工具与数据	工具生态碎片化、集成成本高
Autonomous Agent	长时间自主执行	人工持续参与成本高

Autonomous Agent

Autonomous Agent（自主智能体）代表 Agent 技术发展的最高阶段之一。它不仅能够调用工具、规划任务、检索知识或反思结果，还能够在较长时间内自主完成目标，并根据环境变化持续调整自己的行为。

解决矛盾

Autonomous Agent 的核心能力

能力	作用
Goal（目标管理）	持续围绕目标执行
Planning（规划）	制定长期计划
Workflow（执行）	多步骤执行
Tool Calling	操作外部系统
Autonomous Retrieval	自主检索知识
Memory	保存长期状态
Reflection	自我修正
Multi-Agent	调用其他 Agent
Monitoring	监控执行状态
Replanning	动态重新规划

所有 Agent 技术的综合体。

工作流程

生命周期

研究方向

方向	做什么	解决问题
Long-running Agent	长时间运行	长任务
Goal-oriented Agent	目标驱动	任务管理
Self-Evolving Agent	自我优化	持续成长
Self-Healing Agent	自动恢复	系统故障
Adaptive Planning	动态规划	环境变化
Autonomous Coding	自主开发软件	软件工程
Autonomous Research	自动科研	文献分析
Autonomous Operations	自动运维	企业运维
Digital Employee	数字员工	企业办公

与前面所有 Agent 的关系

Goal

│

Planning

│

Workflow

│

Autonomous Retrieval

│

Tool Calling

│

MCP

│

Memory

│

Reflection

│

Multi-Agent

│

Monitor & Replan

│

Goal Completed