理解函数调用Function Call

RAG 的局限性：

只能"查"不能"做"：传统 RAG 的工作流是 用户提问 -> 向量检索 -> 生成答案。它只能回答"知识库里有什么"（静态知识）。
无法处理实时/业务数据：面对"我还剩几天年假？"、"订单 #12345 到哪了？"或"帮我提交报销"这类需求，RAG 无能为力，因为这些数据不在向量数据库中，而是在业务系统的数据库或 API 里。

传统解决方案的弊端：

定义：

Function Call 是一种让大模型从"只会说话"进化到"能干活"的机制。

工作流程（6步闭环）：

目前主流模型（包括 Qwen）都遵循类似的协议标准。

A. 工具定义 (Tools Definition)

我们需要告诉模型有哪些"武器"可用。通常是一个 JSON 数组，包含函数名、描述和参数定义（JSON Schema）。

示例：定义一个查询年假的工具 getUserAnnualLeave ，需要参数 userId 。

B. 交互协议 (Request & Response)

第一轮请求 (User -> Model)：
- 发送用户问题 + tools 参数 + tool_choice="auto"（让模型自己决定）。
第一轮响应 (Model -> User)：
- 模型不直接回答，而是返回 finish_reason: "tool_calls"。
- 消息体中包含 tool_calls 数组，里面有 id（调用ID）、name（函数名）和 arguments（参数 JSON）。
第二轮请求 (User -> Model)：
- 关键点：需要把完整的对话历史发回去。
- 新增一条 role: "tool" 的消息，包含 tool_call_id（对应第一轮的ID）和 content（函数执行的实际结果）。
第二轮响应 (Model -> User)：
- 模型看到工具返回的结果（例如：剩余5天），生成最终回复："您还剩 5 天年假。"

意图识别：查知识库 vs 调工具

核心思想

将"知识库检索"与"业务工具调用"统一抽象为工具，利用大模型的意图识别能力作为智能路由器，根据用户问题的性质动态选择执行路径，从而实现从"被动问答"到"主动服务"的架构升级。

演进对比

传统 RAG 模式（单一技能）：无论用户提问何种类型，系统强制执行知识库检索。这种方式缺乏灵活性，无法处理实时数据或特定业务逻辑，容易导致模型在面对非文档类问题时产生幻觉。
工具化架构模式（智能调度）：将"搜索知识库"视为一个工具，将"查询业务系统"视为另一个工具。大模型不再直接生成答案，而是先分析用户意图，判断该问题属于"静态知识查询"还是"动态业务操作"，进而自动路由至相应的工具。

虽然 Function Call 很强，但目前落地还有坑：