Dify 内置了两种 Agent 策略:Function Calling 和 ReAct,但二者有什么区别呢?在使用时又该如何选择呢?接下来我们一起来看。

1.Function Calling
Function Call 会通过将用户指令映射到预定义函数或工具,LLM 先识别用户意图,再决定调用哪个函数并提取所需参数。
它的核心是调用外部函数或工具,属于一种明确的工具调用机制。

优点:
- 精确:对于明确的任务,可以直接调用相应的工具,无需复杂的推理过程。
- 易于集成外部功能可以将各种外部 API 或工具封装成函数供模型调用。
- 结构化输出:模型输出的是结构化的函数调用信息,方便下游节点处理。
- 执行效率高:对于简单、明确的任务,执行速度快。
缺点:
- 如果任务定义不明确或用户意图模糊,LLM 可能难以准确选择工具或提取参数。
- 对于需要多轮推理才能确定调用哪个工具的任务,不够灵活。
适用场景:
- 需要根据用户意图精确调用特定工具的自动化任务。
- 需要与外部 API 或服务进行交互的场景。
- 数据检索、信息查询并以特定格式呈现的应用
2.ReAct
ReAct=Reason+Act,推理+行动,LLM 首先思考当前状态和目标,然后选择并调用合适的工具,工具的输出结果又将引导 LLM 进行下一步的思考和行动,如此循环,直到问题解决。
举例说明
举个例子,正常情况下,当我们在计算一个商品的价格时,它的执行步骤是这样的:
- 查询商品原价。
- 计算商品优惠价。
- 计算商品最终价格=商品原价-优惠价。
但某个商品情况比较特殊,它在以上第二步中存储的不是优惠价,而是折扣价(例如 8 折优惠),那么此时商品的最终价格的计算公式就变成了以下方式:
- 查询商品原价。
- 查询商品折扣价。
- 计算商品最终价格=商品原价 X 商品折扣价。
在这种情况下就要使用 ReAct 策略了,因为 ReAct 策略会根据第二步的观测结果,分析并改变第三步的计算公式,保证任务的精准执行,这种情况下就要使用 React 策略。
核心机制:
- ReAct 是一个迭代过程,LLM 在"思考(Reason)-> 行动(Act)-> 观察(Observe)"的循环中逐步推进任务。
- LLM 首先分析当前状态和目标,选择并调用工具,然后根据工具的输出进行下一步的思考和行动,直到问题解决。
优点:
- 利用外部信息:可以有效使用外部工具来收集模型单独无法处理的任务所需的信息。
- 可解释性好:推理和行动步骤交织在一起,允许一定程度上跟踪 Agent 的过程。
- 广泛适用性:适用于需要外部知识或特定行动的任务,例如问答、信息检索和任务执行。
- 灵活性高:对于复杂、多步骤的任务,以及需要探索和动态调整策略的场景,具有更好的适应性。
缺点:
- 执行速度和成本:由于涉及多次 LLM 调用,ReAct 通常比 Function Calling 更慢,并且消耗更多的 tokens。
- 推理稳定性:在很大程度上取决于 LLM 的推理能力以及提示(Instruction)的质量。
- 输出解析复杂:ReAct 过程中 LLM 产生的"思考"文本格式可能不一致,给解析和提取关键信息带来挑战。
适用场景:
- 需要进行探索性研究、从多个来源收集和综合信息的任务。
- 问题解决方案路径不明确,需要通过迭代尝试和调整来找到答案的复杂问题。
- 需要较高可解释性,希望了解 Agent 决策过程的场景。
3.Function Calling VS React
Function Calling 和 React 区别如下:
- Function Calling 更适合简单、明确的任务,强调直接调用工具的高效性。
- ReAct 更适合复杂、多步骤的任务,强调推理过程的灵活性和可解释性。
本文已收录到我的技术小站 www.javacn.site,其中包含的内容有:Spring AI、LangChain4j、Dify、AI Agent、MCP、Function Call、RAG、向量数据库、Prompt、多模态、向量数据库、嵌入模型等内容。