这篇文章终于讲清楚了MCP与Function Calling的关系!

前言

自从大语言模型(LLM)横空出世以来,如何将 LLM 与现有商业系统有效结合、让其真正赋能各类业务,已成为当前最热门的研究方向之一。

Function CallingModel Context Protocol(模型上下文协议,MCP)是实现这种让 LLM 与外部系统进行交互的两种关键技术概念。然而二者在概念上有所重叠,很多人并不能讲出两种概念的区别与联系。

Function Calling

外部系统通常会以函数(function)的形式进行封装,LLM 通过函数调用(function calling)可以实现与外部系统的交互。

工具(Tool)

Function 这个术语实际上已经废弃了,取而代之的是 Tool。Tool 泛指指一切 LLM 能够调用的外部工具。Tool 相比 function 要更加广义,只不过目前的 tool 只有 function calling 这一种形式,因此为了文章方便理解,就这里认为 function 与 tool 是等价的。

Function Calling 具体指的是 LLM 根据用户的自然语言输入,自主决定调用哪些函数,并进行格式化的函数调用的能力

Function Calling 一般的过程如下:

  1. 将用户的自然语言输入与已有函数的描述作为输入参数传给 LLM;
  2. LLM 结合输入参数,决定调用哪些函数,并指明必要参数(如函数的入参),进行格式化(如 JSON、XML 格式)的输出;
  3. 用户端接收到 LLM 格式化的函数调用后,对本地的函数进行调用,得到结果;
  4. 将得到的函数结果传给 LLM,使得 LLM 有了所需的上下文信息。

Function Calling 实际上强调的是 LLM 本身的能力,一些经过特殊训练或调优的 LLM 能够根据用户的自然语言输入决定使用哪些函数,并按约定的格式表达出函数的调用。这里所描述的 "格式",不同 LLM 提供商之间是可能有差异的。假设我们有个叫做 get_weather 的 function,入参为地点 location,不同 LLM 提供商会给出不同的 function calling 格式:

OpenAI ChatGPT:

json 复制代码
{
    "type": "function_call",
    "id": "fc_12345xyz",
    "call_id": "call_12345xyz",
    "name": "get_weather",
    "arguments": "{\"location\": \"Shanghai\"}"
}

Anthropic Claude:

json 复制代码
{
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "<thinking>To answer this question, I will: 1. Use the get_weather tool to get the current weather in San Francisco. 2. Use the get_time tool to get the current time in the America/Los_Angeles timezone, which covers San Francisco, CA.</thinking>"
    },
    {
      "type": "tool_use",
      "id": "toolu_01A09q90qw90lq917835lq9",
      "name": "get_weather",
      "input": {"location": "Shanghai"}
    }
  ]
}

Google Gemini:

json 复制代码
{
  "functionCall": {
    "name": "get_weather",
    "args": {
      "location": "Shanghai"
    }
  }
}

Model Context Protocol (MCP)

当 LLM 发起了一个 function calling 后,这个 calling 最终会需要外部系统进行执行,而 MCP 正是提供了一个通用的协议框架调用外部系统执行这个 function calling。本文不会对 MCP 的概念进行具体说明,假设读者已了解。

带入到上文所述的 function calling 步骤,MCP 实际上规范的就是步骤 3,也就是函数的具体执行过程。无论 LLM 返回的 function calling 是什么样子的格式,在步骤 3 时都需要转换成 MCP 所规定的 API 数据结构(这一步转换应该是 MCP host 需要做的),并需要 LLM 用户侧按照 MCP 的规范进行响应的处理。例如对于上文的 get_weather ,MCP server 接收到的请求结构必须是这样的 JSON-RPC:

json 复制代码
{
  "jsonrpc": "2.0",
  "id": 129,
  "method": "tools/call",
  "params": {
    "name": "get_weather",
    "arguments": {
      "location": "Shanghai"
    }
  }
}

MCP client 接收到的响应则是类似于这样的 JSON-RPC:

json 复制代码
{
  "jsonrpc": "2.0",
  "id": 2,
  "result": {
    "content": [
      {
        "type": "text",
        "text": "Current weather in Shanghai:\nTemperature: 12°C\nConditions: Partly cloudy"
      }
    ],
    "isError":false
  }
}

MCP 标准化了 LLM 应用与外部系统的以下交互过程:

  • 动态地提供对可用函数的标准化的描述(比如通过 tools/list API);
  • 标准化对外部系统的调用与结果的处理(MCP 规范了 MCP server 需要有哪些 API 能力,以及 API 的请求/相应数据结构)。

如果没有 MCP 这样的协议规范,不同团队的 LLM 应用需要:

  • 自行维护可用函数列表;
  • 外部系统的接入需要进行针对适配,不具有通用性。

现在只要一个 LLM 应用有 MCP client 的功能,那么它就一定能支持接入任何具有 MCP server 功能的外部系统,且不需要额外的适配成本,MCP 很好地构建了 LLM 应用的大生态。

总结

总结来说,function calling 与 MCP 是具有一定联系,但侧重点不同的两个技术概念。前者侧重于描述 LLM 本身具有的结构化函数调用能力(调用哪些函数),后者则侧重于描述函数的规范化执行(怎么执行被调用的函数),大概就是分配与执行的关系。

下面的表格提炼了两者的主要联系与区别,希望对理解本文有帮助:

比较维度 Function Calling MCP
主要职责 解析用户意图并选择合适的函数调用,并进行格式化输出 规范化函数的具体执行过程,即规范 LLM 应用与外部系统的交互
责任方 各 LLM 提供商 LLM 应用(client 端)、外部系统(server 端)
数据结构 应 LLM 提供商而有所不同 规范的 JSON-RPC
相关推荐
乾元2 分钟前
拒绝服务的进化:AI 调度下的分布式协同攻击策略
人工智能·分布式
困死,根本不会3 分钟前
OpenCV摄像头实时处理:从单特征到联合识别(形状识别 + 颜色识别 + 形状颜色联合识别)
人工智能·opencv·计算机视觉
工具人呵呵4 分钟前
[嵌入式AI从0开始到入土]22_基于昇腾310P RC模式的ACT模型部署实践
人工智能
yj_sharing5 分钟前
PyTorch深度学习实战:从模型构建到训练技巧
人工智能·pytorch·深度学习
安全二次方security²6 分钟前
CUDA C++编程指南(7.31&32&33&34)——C++语言扩展之性能分析计数器函数和断言、陷阱、断点函数
c++·人工智能·nvidia·cuda·断点·断言·性能分析计数器函数
bksheng8 分钟前
【Dify】安装与部署
人工智能
狸奴算君8 分钟前
告别数据泄露:三步构建企业级AI的隐私保护盾
人工智能
Christo315 分钟前
TKDE-2026《Efficient Co-Clustering via Bipartite Graph Factorization》
人工智能·算法·机器学习·数据挖掘
jackylzh15 分钟前
PyTorch 2.x 中 `torch.load` 的 `FutureWarning` 与 `weights_only=False` 参数分析
人工智能·pytorch·python
叶庭云22 分钟前
AI Agent KernelCAT:深耕算子开发和模型迁移的 “计算加速专家”
人工智能·运筹优化·算子·ai agent·kernelcat·模型迁移适配·生态壁垒