这篇文章终于讲清楚了MCP与Function Calling的关系!

前言

自从大语言模型(LLM)横空出世以来,如何将 LLM 与现有商业系统有效结合、让其真正赋能各类业务,已成为当前最热门的研究方向之一。

Function CallingModel Context Protocol(模型上下文协议,MCP)是实现这种让 LLM 与外部系统进行交互的两种关键技术概念。然而二者在概念上有所重叠,很多人并不能讲出两种概念的区别与联系。

Function Calling

外部系统通常会以函数(function)的形式进行封装,LLM 通过函数调用(function calling)可以实现与外部系统的交互。

工具(Tool)

Function 这个术语实际上已经废弃了,取而代之的是 Tool。Tool 泛指指一切 LLM 能够调用的外部工具。Tool 相比 function 要更加广义,只不过目前的 tool 只有 function calling 这一种形式,因此为了文章方便理解,就这里认为 function 与 tool 是等价的。

Function Calling 具体指的是 LLM 根据用户的自然语言输入,自主决定调用哪些函数,并进行格式化的函数调用的能力

Function Calling 一般的过程如下:

  1. 将用户的自然语言输入与已有函数的描述作为输入参数传给 LLM;
  2. LLM 结合输入参数,决定调用哪些函数,并指明必要参数(如函数的入参),进行格式化(如 JSON、XML 格式)的输出;
  3. 用户端接收到 LLM 格式化的函数调用后,对本地的函数进行调用,得到结果;
  4. 将得到的函数结果传给 LLM,使得 LLM 有了所需的上下文信息。

Function Calling 实际上强调的是 LLM 本身的能力,一些经过特殊训练或调优的 LLM 能够根据用户的自然语言输入决定使用哪些函数,并按约定的格式表达出函数的调用。这里所描述的 "格式",不同 LLM 提供商之间是可能有差异的。假设我们有个叫做 get_weather 的 function,入参为地点 location,不同 LLM 提供商会给出不同的 function calling 格式:

OpenAI ChatGPT:

json 复制代码
{
    "type": "function_call",
    "id": "fc_12345xyz",
    "call_id": "call_12345xyz",
    "name": "get_weather",
    "arguments": "{\"location\": \"Shanghai\"}"
}

Anthropic Claude:

json 复制代码
{
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "<thinking>To answer this question, I will: 1. Use the get_weather tool to get the current weather in San Francisco. 2. Use the get_time tool to get the current time in the America/Los_Angeles timezone, which covers San Francisco, CA.</thinking>"
    },
    {
      "type": "tool_use",
      "id": "toolu_01A09q90qw90lq917835lq9",
      "name": "get_weather",
      "input": {"location": "Shanghai"}
    }
  ]
}

Google Gemini:

json 复制代码
{
  "functionCall": {
    "name": "get_weather",
    "args": {
      "location": "Shanghai"
    }
  }
}

Model Context Protocol (MCP)

当 LLM 发起了一个 function calling 后,这个 calling 最终会需要外部系统进行执行,而 MCP 正是提供了一个通用的协议框架调用外部系统执行这个 function calling。本文不会对 MCP 的概念进行具体说明,假设读者已了解。

带入到上文所述的 function calling 步骤,MCP 实际上规范的就是步骤 3,也就是函数的具体执行过程。无论 LLM 返回的 function calling 是什么样子的格式,在步骤 3 时都需要转换成 MCP 所规定的 API 数据结构(这一步转换应该是 MCP host 需要做的),并需要 LLM 用户侧按照 MCP 的规范进行响应的处理。例如对于上文的 get_weather ,MCP server 接收到的请求结构必须是这样的 JSON-RPC:

json 复制代码
{
  "jsonrpc": "2.0",
  "id": 129,
  "method": "tools/call",
  "params": {
    "name": "get_weather",
    "arguments": {
      "location": "Shanghai"
    }
  }
}

MCP client 接收到的响应则是类似于这样的 JSON-RPC:

json 复制代码
{
  "jsonrpc": "2.0",
  "id": 2,
  "result": {
    "content": [
      {
        "type": "text",
        "text": "Current weather in Shanghai:\nTemperature: 12°C\nConditions: Partly cloudy"
      }
    ],
    "isError":false
  }
}

MCP 标准化了 LLM 应用与外部系统的以下交互过程:

  • 动态地提供对可用函数的标准化的描述(比如通过 tools/list API);
  • 标准化对外部系统的调用与结果的处理(MCP 规范了 MCP server 需要有哪些 API 能力,以及 API 的请求/相应数据结构)。

如果没有 MCP 这样的协议规范,不同团队的 LLM 应用需要:

  • 自行维护可用函数列表;
  • 外部系统的接入需要进行针对适配,不具有通用性。

现在只要一个 LLM 应用有 MCP client 的功能,那么它就一定能支持接入任何具有 MCP server 功能的外部系统,且不需要额外的适配成本,MCP 很好地构建了 LLM 应用的大生态。

总结

总结来说,function calling 与 MCP 是具有一定联系,但侧重点不同的两个技术概念。前者侧重于描述 LLM 本身具有的结构化函数调用能力(调用哪些函数),后者则侧重于描述函数的规范化执行(怎么执行被调用的函数),大概就是分配与执行的关系。

下面的表格提炼了两者的主要联系与区别,希望对理解本文有帮助:

比较维度 Function Calling MCP
主要职责 解析用户意图并选择合适的函数调用,并进行格式化输出 规范化函数的具体执行过程,即规范 LLM 应用与外部系统的交互
责任方 各 LLM 提供商 LLM 应用(client 端)、外部系统(server 端)
数据结构 应 LLM 提供商而有所不同 规范的 JSON-RPC
相关推荐
小北的AI科技分享几秒前
API管理的五种路径:五款工具的功能侧写与数据支撑
大数据·人工智能·api管理
展示猪肝1 分钟前
Vue2 + FastAPI + Dify 实现 AI 医疗预检分诊助手:从问诊追问到医生审核闭环
人工智能·vue·fastapi·dify
容器魔方1 分钟前
“驾驭工程”下一跳?JiuwenClaw AgentTeam开启“协同工程”全新范式
人工智能·云原生·容器·架构·开源
夕小瑶2 分钟前
Codex上线手机端啦!免费用户可用
人工智能
极客老王说Agent3 分钟前
2026供应商寻源新范式:实在Agent供应商寻源智能助理核心功能与落地案例深度解析
人工智能·ai·chatgpt
科智咨询5 分钟前
2026 AI智能体落地纪实:谁在用?用在哪?
大数据·人工智能·科技·aigc
LedgerNinja6 分钟前
Auvera Chain 宣布 AI 驱动的 Layer 2 网络测试网正式上线
人工智能
禾刀围玉8 分钟前
基于FPGA的卷积神经网络实现-方案构想
人工智能·fpga开发·cnn
Komorebi_99999 分钟前
Agent 易混概念辨析 + 全套总复盘
人工智能·agent
YuanDaima20489 分钟前
Docker 核心架构与底层技术原理解析
运维·人工智能·docker·微服务·容器·架构·个人开发