Datawhale26年1月组队学习:Agentic AI+Task1工作流简介

智能体设计模式 Agentic design patterns

智能体工作流的核心思想是将复杂的任务分解为一系列基础"构建模块"(building blocks),然后通过特定的设计模式将这些模块组合、串联起来,从而构建出能够处理复杂问题的系统。
一、反思 (Reflection)

核心概念:让模型对自己的输出进行检查、评估和改进。

工作流程:

(1)初始生成:模型根据任务要求生成一个初步结果(如代码)。

(2)自我评估/外部评估: 将该结果作为输入,再次提示同一个或另一个模型,要求其对结果进行批判性分析(如检查正确性、风格、效率,并给出改进建议)。

(3)迭代优化:将评估反馈(如"第5行有bug"或"单元测试失败")提供给模型,让它基于反馈生成一个更好的版本。

(4)循环往复:此过程可以多次迭代,直到达到满意的质量。

关键点:

这是一种非常有效的性能提升技术,虽然不能保证100%完美,但能带来显著的性能提升。

"反思"可以由同一个模型完成,也可以引入一个专门扮演"审查者"角色的独立模型(即多智能体协作的雏形)。

评估标准可以是客观的(如代码是否能运行),也可以是主观的(如代码风格)。

二、工具使用 (Tool Use)

核心概念:赋予语言模型调用外部工具或函数的能力,以扩展其功能边界。

工作流程:

识别需求:模型在处理任务时,判断需要调用哪个工具。

调用工具:模型生成调用该工具的指令或参数。

执行与返回:工具执行操作(如搜索网络、计算数学公式),并将结果返回给模型。

整合结果:模型利用工具返回的结果来完成最终任务。

工具类型举例:

信息收集:Web search, Wikipedia, Database access.

分析计算:Code Execution, Wolfram Alpha, Bearly Code Interpreter.

生产力:Email, Calendar, Messaging.

图像处理:Image generation, Image captioning, OCR.

关键点:工具使用极大地增强了模型的能力,使其不再局限于文本生成,而是能与现实世界互动并解决更广泛的问题。

三、规划 (Planning)

核心概念:让模型自主决定完成一个复杂任务所需的步骤序列,而不是由开发者硬编码。

工作流程:

任务理解: 模型接收一个复杂请求(如"生成一张女孩读书的图片,姿势与示例图中的男孩相同")。

路径规划: 模型自动分解任务,决定需要调用哪些工具以及调用的顺序。

例如:先用 openpose 模型提取男孩的姿势 -> 再用 google/vit 模型根据该姿势生成女孩的图片 -> 接着用 vit-gpt2 模型描述图片 -> 最后用 fastspeech 模型将描述转为语音。

执行: 按照规划的步骤依次执行。

关键点:

这种方式比硬编码的流程更灵活,但控制难度更大,也更具实验性。

它允许模型在面对新任务时,自行构思解决方案,有时会产生令人惊喜的结果。

四、多智能体协作 (Multi-agent collaboration)

核心概念: 雇佣多个具有不同专长的角色(智能体)协同工作,共同完成一个复杂项目。
工作流程:

角色分配: 为不同的智能体分配特定角色(如研究员、市场专员、编辑)。

分工合作: 各个智能体根据自己的角色和能力,执行相应的子任务。

沟通协调: 智能体之间相互沟通、传递信息,共同推进项目。
关键点:

o 多智能体协作通常能产生比单个智能体更好的结果,尤其在处理复杂任务(如撰写人物传记、下棋)时。

o 研究表明,多智能体系统在多项任务上的表现优于单智能体系统。

o 其缺点是更难控制和调试,因为无法提前预知各个智能体的行为。

相关推荐
冬奇Lab3 分钟前
RAG 系列(五):Embedding 模型——语义理解的核心
人工智能·llm·aigc
深小乐5 分钟前
AI 周刊【2026.04.27-05.03】:Anthropic 9000亿美元估值、英伟达死磕智能体、中央重磅定调AI
人工智能
码点滴8 分钟前
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?
人工智能·gpt·架构·大模型·deepseek
狐狐生风19 分钟前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai
波动几何22 分钟前
CDA架构代码工坊技能cda-code-lab
人工智能
舟遥遥娓飘飘27 分钟前
DeepSeek V4技术变革对社会结构与职业体系的重构
人工智能
狐狐生风28 分钟前
LangChain RAG 基础
人工智能·python·学习·langchain·rag·agentai
墨北小七1 小时前
使用InspireFace进行智慧楼宇门禁人脸识别的训练微调
人工智能·深度学习·神经网络
HackTorjan1 小时前
深度神经网络的反向传播与梯度优化原理
人工智能·spring boot·神经网络·机器学习·dnn
PersistJiao1 小时前
Codex、Claude Code、gstack三者的关系
人工智能