MCP到底是什么?

前言

最近学习了MCP,在查看了很多视频与文章后,终于对MCP有了一个完整的认识。这里对MCP的概念进行梳理以深化并加深自己的理解。以下内容不会涉及任何代码,只是介绍当前我对MCP的认知。

大模型为什么要调用工具

主要有两点:

  1. 大模型的训练数据存在时效性和专业性的限制,无法获取实时信息,以及专业信息。
  2. 模型本身无法处理一些复杂的计算逻辑,通过调用外部工具可以弥补自身的不足。

大模型调用工具的完整过程

以用户查询北京天气为例,整个流程如下所示:

sequenceDiagram actor 用户 participant 大模型应用 participant 天气工具 participant 大模型 用户->>大模型应用: 1、查询北京天气 大模型应用->>大模型: 2、转发查询请求 (提供工具列表,与用户请求) 大模型->>大模型: 3、判断需要外部工具 (天气工具) 大模型->>大模型: 3.1、构造工具调用参数 大模型->>大模型应用: 4、请求调用天气工具 大模型应用->>天气工具: 5、调用天气工具 (北京) 天气工具-->>大模型应用: 6、返回北京天气数据 大模型应用->>大模型: 7、将天气信息与用户历史询问信息一起发送给大模型 大模型->>大模型: 8、生成天气查询结果 大模型-->>大模型应用: 9、返回天气查询结果 大模型应用-->>用户: 10、显示北京天气信息

该流程主要分为四步:

  1. 工具注册: 大模型应用将可用工具列表,加入到大模型的提示词中。
  2. 意图识别与工具选择:大模型解析用户问题,判断需调用哪个工具,并生成请求参数。
  3. 工具调用: 大模型应用接收大模型的返回信息,判断出需要调用工具,进行工具调用。
  4. 整合回复: 将工具结果与用户问题发送给大模型,大模型整合后返回回复结果。

在这个过程中,大模型本身并不会调用工具,而是进行意图识别、工具决策,并构造请求参数。 调用工具的是大模型应用。

那么这个流程有什么问题?MCP和这个流程有什么关系?

我们先了解下这个流程中的M * N问题。

工具集成M * N问题

MCP的文章中提到解决了工具集成的M * N问题。(我们有M个工具 ,要集成到N个大模型中)

首先要了解:M * N问题主要发生在工具调用的第一步,也就是工具注册阶段。

在工具注册阶段,大模型应用要告诉大模型,我有M个工具,以及这些工具是做什么的,都有什么参数。

问题出在了每个大模型接受工具列表的形式不同,格式也不同。(其实返回参数也不同,这里以接受参数为例)

例如,有的模型需要json格式,有些模型需要xml格式,有些模型需要自然语言。

因此如果程序员想要新增或者修改一个工具,必须去不同的大模型中进行对接或者修改,也就有了M * N的问题。

MCP如何解决M * N的问题

MCP就是为了解决这个问题出现的。 但是必须要注意的是,MCP并非是统一了各个大模型接收工具的参数,而是在工具与模型之间增加了一个"中间层",它提供了工具描述规范调用规约

  1. 各个工具按照MCP协议的要求来描述工具信息。
  2. MCP HOST按照各个模型不同的要求,来描述工具信息。
  3. 大模型按照MCP协议要求来返回标准化的工具调用。

对于工具而言,通过MCP HOST来屏蔽模型之间的差异,做到一次封装,多处复用。因此通过MCP协议,将工具接入的工作量从M * N 降到了M + N。

MCP是什么?

所以MCP到底是什么呢,引用一下官方的定义吧:

MCP 是一种开放协议,它标准化了应用程序如何向 LLM 提供上下文。可将 MCP 视为 AI 应用程序的 USB-C 端口------正如 USB-C 提供设备连接外围配件的标准化方式,MCP 提供将 AI 模型连接到不同数据源和工具的标准化方式。

官方定义地址

但是我觉得改成 MCP提供了一种标准化方式,允许不同数据源和工具通过统一接口描述与AI应用进行交互 反而更容易理解。

以上仅是我自己的理解,如有错误欢迎指正。

相关推荐
Token_w15 分钟前
CANN算子量化——AIGC轻量化部署的低精度算子适配方案
aigc
那个村的李富贵15 分钟前
CANN驱动下的AIGC“智能抠图”:基于Mask2Former的高性能图像分割实战
aigc·cann
Lethehong36 分钟前
深入CANN核心:从ops-nn算子库到AIGC加速的底层实践
aigc
那个村的李富贵1 小时前
智能炼金术:CANN加速的新材料AI设计系统
人工智能·算法·aigc·cann
七月稻草人1 小时前
算子筑底 AIGC 提速:CANN ops-nn 的底层计算革新之路
aigc
永远都不秃头的程序员(互关)1 小时前
CANN Graph Engine深度优化AIGC控制流:从训练图到高效推理的蜕变
aigc
云边有个稻草人1 小时前
CANN ops-nn:筑牢AIGC的神经网络算子算力底座
人工智能·神经网络·aigc·cann
心疼你的一切1 小时前
数字智人:CANN加速的实时数字人生成与交互
数据仓库·深度学习·aigc·交互·cann
云边有个稻草人1 小时前
算子为核,生成无限:CANN ops-nn驱动AIGC底层计算革新
aigc
那个村的李富贵1 小时前
CANN赋能AIGC“数字人”革命:实时视频换脸与表情驱动实战
aigc·音视频