MCP到底是什么?

前言

最近学习了MCP,在查看了很多视频与文章后,终于对MCP有了一个完整的认识。这里对MCP的概念进行梳理以深化并加深自己的理解。以下内容不会涉及任何代码,只是介绍当前我对MCP的认知。

大模型为什么要调用工具

主要有两点:

  1. 大模型的训练数据存在时效性和专业性的限制,无法获取实时信息,以及专业信息。
  2. 模型本身无法处理一些复杂的计算逻辑,通过调用外部工具可以弥补自身的不足。

大模型调用工具的完整过程

以用户查询北京天气为例,整个流程如下所示:

sequenceDiagram actor 用户 participant 大模型应用 participant 天气工具 participant 大模型 用户->>大模型应用: 1、查询北京天气 大模型应用->>大模型: 2、转发查询请求 (提供工具列表,与用户请求) 大模型->>大模型: 3、判断需要外部工具 (天气工具) 大模型->>大模型: 3.1、构造工具调用参数 大模型->>大模型应用: 4、请求调用天气工具 大模型应用->>天气工具: 5、调用天气工具 (北京) 天气工具-->>大模型应用: 6、返回北京天气数据 大模型应用->>大模型: 7、将天气信息与用户历史询问信息一起发送给大模型 大模型->>大模型: 8、生成天气查询结果 大模型-->>大模型应用: 9、返回天气查询结果 大模型应用-->>用户: 10、显示北京天气信息

该流程主要分为四步:

  1. 工具注册: 大模型应用将可用工具列表,加入到大模型的提示词中。
  2. 意图识别与工具选择:大模型解析用户问题,判断需调用哪个工具,并生成请求参数。
  3. 工具调用: 大模型应用接收大模型的返回信息,判断出需要调用工具,进行工具调用。
  4. 整合回复: 将工具结果与用户问题发送给大模型,大模型整合后返回回复结果。

在这个过程中,大模型本身并不会调用工具,而是进行意图识别、工具决策,并构造请求参数。 调用工具的是大模型应用。

那么这个流程有什么问题?MCP和这个流程有什么关系?

我们先了解下这个流程中的M * N问题。

工具集成M * N问题

MCP的文章中提到解决了工具集成的M * N问题。(我们有M个工具 ,要集成到N个大模型中)

首先要了解:M * N问题主要发生在工具调用的第一步,也就是工具注册阶段。

在工具注册阶段,大模型应用要告诉大模型,我有M个工具,以及这些工具是做什么的,都有什么参数。

问题出在了每个大模型接受工具列表的形式不同,格式也不同。(其实返回参数也不同,这里以接受参数为例)

例如,有的模型需要json格式,有些模型需要xml格式,有些模型需要自然语言。

因此如果程序员想要新增或者修改一个工具,必须去不同的大模型中进行对接或者修改,也就有了M * N的问题。

MCP如何解决M * N的问题

MCP就是为了解决这个问题出现的。 但是必须要注意的是,MCP并非是统一了各个大模型接收工具的参数,而是在工具与模型之间增加了一个"中间层",它提供了工具描述规范调用规约

  1. 各个工具按照MCP协议的要求来描述工具信息。
  2. MCP HOST按照各个模型不同的要求,来描述工具信息。
  3. 大模型按照MCP协议要求来返回标准化的工具调用。

对于工具而言,通过MCP HOST来屏蔽模型之间的差异,做到一次封装,多处复用。因此通过MCP协议,将工具接入的工作量从M * N 降到了M + N。

MCP是什么?

所以MCP到底是什么呢,引用一下官方的定义吧:

MCP 是一种开放协议,它标准化了应用程序如何向 LLM 提供上下文。可将 MCP 视为 AI 应用程序的 USB-C 端口------正如 USB-C 提供设备连接外围配件的标准化方式,MCP 提供将 AI 模型连接到不同数据源和工具的标准化方式。

官方定义地址

但是我觉得改成 MCP提供了一种标准化方式,允许不同数据源和工具通过统一接口描述与AI应用进行交互 反而更容易理解。

以上仅是我自己的理解,如有错误欢迎指正。

相关推荐
win4r18 小时前
🚀保姆级教程!GitHub Copilot CLI横空出世,支持MCP扩展+自动PR创建,让AI编程效率提升1000%,开发者必看!开发完整应用实战演示!
aigc·openai·github copilot
Jagger_18 小时前
Spec-Kit 使用指南:让AI开发更规范、更高效
aigc·ai编程·cursor
Mintopia20 小时前
🌩️ 云边协同架构下的 WebAI 动态资源调度技术
前端·javascript·aigc
元闰子20 小时前
对 Agent-First 数据库的畅想
数据库·后端·aigc
doubao361 天前
审美积累,顶刊论文插图原理图、流程图
人工智能·经验分享·aigc·ai写作·绘图·文献综述·科研绘图
杀生丸学AI1 天前
【无标题】SceneSplat:基于视觉-语言预训练的3DGS场景理解
3d·aigc·slam·语义分割·三维重建·视觉大模型·空间智能
墨风如雪1 天前
告别纸上谈兵:Meta CWM让AI代码真正活起来
aigc
唐某人丶1 天前
教你如何用 JS 实现 Agent 系统(3)—— 借鉴 Cursor 的设计模式实现深度搜索
前端·人工智能·aigc
coder_pig1 天前
Claude Code + Holopix AI | 轻松复刻 "虚假广告"-🧟‍♀️射击小游戏
aigc·ai编程·claude
coder_pig1 天前
玩转 Claude Code CLI | 1、安装配置 & 基本使用
aigc·ai编程·claude