这篇文章终于讲清楚了MCP与Function Calling的关系!

前言

自从大语言模型(LLM)横空出世以来,如何将 LLM 与现有商业系统有效结合、让其真正赋能各类业务,已成为当前最热门的研究方向之一。

Function CallingModel Context Protocol(模型上下文协议,MCP)是实现这种让 LLM 与外部系统进行交互的两种关键技术概念。然而二者在概念上有所重叠,很多人并不能讲出两种概念的区别与联系。

Function Calling

外部系统通常会以函数(function)的形式进行封装,LLM 通过函数调用(function calling)可以实现与外部系统的交互。

工具(Tool)

Function 这个术语实际上已经废弃了,取而代之的是 Tool。Tool 泛指指一切 LLM 能够调用的外部工具。Tool 相比 function 要更加广义,只不过目前的 tool 只有 function calling 这一种形式,因此为了文章方便理解,就这里认为 function 与 tool 是等价的。

Function Calling 具体指的是 LLM 根据用户的自然语言输入,自主决定调用哪些函数,并进行格式化的函数调用的能力

Function Calling 一般的过程如下:

  1. 将用户的自然语言输入与已有函数的描述作为输入参数传给 LLM;
  2. LLM 结合输入参数,决定调用哪些函数,并指明必要参数(如函数的入参),进行格式化(如 JSON、XML 格式)的输出;
  3. 用户端接收到 LLM 格式化的函数调用后,对本地的函数进行调用,得到结果;
  4. 将得到的函数结果传给 LLM,使得 LLM 有了所需的上下文信息。

Function Calling 实际上强调的是 LLM 本身的能力,一些经过特殊训练或调优的 LLM 能够根据用户的自然语言输入决定使用哪些函数,并按约定的格式表达出函数的调用。这里所描述的 "格式",不同 LLM 提供商之间是可能有差异的。假设我们有个叫做 get_weather 的 function,入参为地点 location,不同 LLM 提供商会给出不同的 function calling 格式:

OpenAI ChatGPT:

json 复制代码
{
    "type": "function_call",
    "id": "fc_12345xyz",
    "call_id": "call_12345xyz",
    "name": "get_weather",
    "arguments": "{\"location\": \"Shanghai\"}"
}

Anthropic Claude:

json 复制代码
{
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "<thinking>To answer this question, I will: 1. Use the get_weather tool to get the current weather in San Francisco. 2. Use the get_time tool to get the current time in the America/Los_Angeles timezone, which covers San Francisco, CA.</thinking>"
    },
    {
      "type": "tool_use",
      "id": "toolu_01A09q90qw90lq917835lq9",
      "name": "get_weather",
      "input": {"location": "Shanghai"}
    }
  ]
}

Google Gemini:

json 复制代码
{
  "functionCall": {
    "name": "get_weather",
    "args": {
      "location": "Shanghai"
    }
  }
}

Model Context Protocol (MCP)

当 LLM 发起了一个 function calling 后,这个 calling 最终会需要外部系统进行执行,而 MCP 正是提供了一个通用的协议框架调用外部系统执行这个 function calling。本文不会对 MCP 的概念进行具体说明,假设读者已了解。

带入到上文所述的 function calling 步骤,MCP 实际上规范的就是步骤 3,也就是函数的具体执行过程。无论 LLM 返回的 function calling 是什么样子的格式,在步骤 3 时都需要转换成 MCP 所规定的 API 数据结构(这一步转换应该是 MCP host 需要做的),并需要 LLM 用户侧按照 MCP 的规范进行响应的处理。例如对于上文的 get_weather ,MCP server 接收到的请求结构必须是这样的 JSON-RPC:

json 复制代码
{
  "jsonrpc": "2.0",
  "id": 129,
  "method": "tools/call",
  "params": {
    "name": "get_weather",
    "arguments": {
      "location": "Shanghai"
    }
  }
}

MCP client 接收到的响应则是类似于这样的 JSON-RPC:

json 复制代码
{
  "jsonrpc": "2.0",
  "id": 2,
  "result": {
    "content": [
      {
        "type": "text",
        "text": "Current weather in Shanghai:\nTemperature: 12°C\nConditions: Partly cloudy"
      }
    ],
    "isError":false
  }
}

MCP 标准化了 LLM 应用与外部系统的以下交互过程:

  • 动态地提供对可用函数的标准化的描述(比如通过 tools/list API);
  • 标准化对外部系统的调用与结果的处理(MCP 规范了 MCP server 需要有哪些 API 能力,以及 API 的请求/相应数据结构)。

如果没有 MCP 这样的协议规范,不同团队的 LLM 应用需要:

  • 自行维护可用函数列表;
  • 外部系统的接入需要进行针对适配,不具有通用性。

现在只要一个 LLM 应用有 MCP client 的功能,那么它就一定能支持接入任何具有 MCP server 功能的外部系统,且不需要额外的适配成本,MCP 很好地构建了 LLM 应用的大生态。

总结

总结来说,function calling 与 MCP 是具有一定联系,但侧重点不同的两个技术概念。前者侧重于描述 LLM 本身具有的结构化函数调用能力(调用哪些函数),后者则侧重于描述函数的规范化执行(怎么执行被调用的函数),大概就是分配与执行的关系。

下面的表格提炼了两者的主要联系与区别,希望对理解本文有帮助:

比较维度 Function Calling MCP
主要职责 解析用户意图并选择合适的函数调用,并进行格式化输出 规范化函数的具体执行过程,即规范 LLM 应用与外部系统的交互
责任方 各 LLM 提供商 LLM 应用(client 端)、外部系统(server 端)
数据结构 应 LLM 提供商而有所不同 规范的 JSON-RPC
相关推荐
林林宋1 分钟前
DiTAR: Diffusion Transformer Autoregressive Modeling for Speech Generation
人工智能·深度学习·transformer
摘星编程18 分钟前
华为云Flexus+DeepSeek征文 | 基于Dify和DeepSeek-R1开发企业级AI Agent全流程指南
人工智能·华为云·deepseek·华为云flexus·dify-llm
lucky_lyovo20 分钟前
机器学习-线性回归基础
人工智能·机器学习·线性回归
一洽客服系统1 小时前
技术为器,服务为本:AI时代的客服价值重构
人工智能
moonsims3 小时前
无人机桥梁3D建模的拍摄频率
人工智能
LaughingZhu5 小时前
PH热榜 | 2025-05-29
前端·人工智能·经验分享·搜索引擎·产品运营
视觉语言导航6 小时前
俄罗斯无人机自主任务规划!UAV-CodeAgents:基于多智能体ReAct和视觉语言推理的可扩展无人机任务规划
人工智能·深度学习·无人机·具身智能
世润6 小时前
深度学习-梯度消失和梯度爆炸
人工智能·深度学习
小彭律师6 小时前
LSTM+Transformer混合模型架构文档
人工智能·lstm·transformer
-曾牛6 小时前
使用Spring AI集成Perplexity AI实现智能对话(详细配置指南)
java·人工智能·后端·spring·llm·大模型应用·springai