Agent 设计模式

1、Chain of Thought(思维链)

提出背景:Google Research 在 2022年发表的论文《Chain-of-Thought Prompting ElicitsReasoning in Large Language Models》。核心思想:让模型在回答前，把推理过程一步步写出来。不是一口气报出答案，而是把整个推理过程展示出来。

场景例子:问小王比小李大1岁，小张的年龄是小李的两倍。如果三个人的年龄加起来是 41.岁，问小王多大?思维链方式:假设小李的年龄是x，那么小王=x+3，小张=2x，总和=(x+1)+x+(2x)=4x+1，4x+1=41，4x=38，x=10，所以小王=10+3=13。结果小王 13岁。这种方式在逻辑推理、数值计算、逐步分析类问题里，会显得更稳健。

2、Self-Ask(自问自答)提出背景:

Microsoft Research在 2022年的研究工作《Self-Ask with Search》，出自论文《Measuring and Narrowing the Compositionality Gap in Language Models》核心思想:让模型在回答时学会"反问自己"，把大问题拆成多个小问题，然后逐个回答场景例子:问2016 年奥斯卡最佳男主角的年龄是多少?Self-AsK会先问:2016年奥斯卡最佳男主是谁?(答:李奥纳多·狄卡比奥)，再问他当时多大?(答:41岁)，最后组合答案。这种方式特别适合事实链路长的问题。

3、ReAct(推理+行动)

提出背景:Princeton与Google Research在2022年论文《ReAct: Synergizing Reasoningand Acting in Language Models》.

核心思想:在推理(Reasoning)和外部行动(Acting，比如调用搜索引擎或API)之间交替进行。ReAct 比 CoT、Self-Ask更全能，原因在于它不仅是推理模式，还内建了与外部世界交互的闭环。

场景例子:问杭州昨天的天气?ReAct会先想:"我不知道昨天的天气，需要查询"然后执行"调用天气 API"，再推理并回答。这让 Agent 既有思维，又能动手。

4、Plan-and-Execute(计划与执行)

提出背景:出现在 2023 年前后的 Agent 应用开发框架实践(如 LangChain 社区)核心思想:把任务拆成两个阶段，先生成计划(Planning)，再逐步执行(Execution)场景例子:假设你让 Agent写一篇"新能源车的市场调研报告"，它不会直接生成报告，而是先拟定计划:收集销量数据，分析政策趋势，总结消费者反馈，写结论。然后逐条执行。适合多步骤、需长时间任务的场景。

5、Tree of Thoughts(ToT，树状思维)

提出背景:Princeton和 DeepMind在 2023年的论文《Tree of Thoughts: Deliberate Problem Solving with Large Language Models》。核心思想:不是单线思维，而是生成多条思路分支，像树一样展开，再通过评估机制选出最佳分支。

场景例子:解一道数独时，Agent会尝试多个候选解法(分支A、B、C)，逐步排除错误分.

支，最终选出唯一解。适合复杂规划和解谜任务。

6、Reflexion /lterative Refinement(反思与迭代优化)

提出背景:2023年论文《Reflexion:Language Agents with Verbal Reinforcement Learning》。

核心思想:Agent 具备自我纠错的能力，犯错后会总结失败原因，再带着反思尝试下一次。场景例子:让 Agent 写一段 Python 代码，如果第一次运行报错，它会读报错信息，反思"，然后自动修正并重试。适合代码生成、流程执行类场景。"函数参数写错了"

7、Role-playing Agents(角色扮演式智能体或者说是多智能体协作)

提出背景:源自 AutoGPT、ChatDev、CAMEL等社区项目。核心思想:把任务拆分给不同角色的 Agent，每个 Agent都有专属职责，通过对话协作完成任务。

场景例子:一个软件开发任务里，有产品经理 Agent写需求文档，程序员 Agent 写代码，测

试 Agent 写测试用例。它们像团队一样协作。适合复杂系统开发或跨职能协同。

这些认知框架，其实构成了 Agent世界里的思维模式库:

CoT：一步步写过程

Self-Ask：拆分成小问题

ReAct：既思考也动手

Plan-Execute：先计划再执行

TOT：树状多分支探索

Reflexion：自我反思迭代

Role-playing：多人协作分工

它们并不是互斥的，可以混搭使用，理解这些模式，能让我们在应用开发框架选型和使用时，想的更为透彻，一些设计模式，例如 ReAct，已经被 LangChain、Llamandex、Dify、SpringAlAlibaba 等 Agent 开发框架内置成基础框架，帮助开发者提升模型的调用效果。