~犬📰余~
"我欲贱而贵,愚而智,贫而富,可乎? 曰:其唯学乎"
一、MCP解决什么问题?
\quad 在过去的几年中,AI大模型快速发展,从横空出世的GPT到"AI界拼多多"DeepSeek,大量的大语言模型(LLM)你追我赶,带来了一波又一波的AI热潮,然而,这些LLM一直面临着三大瓶颈:
-
工具连接碎片化
\quad 传统AI调用外部工具需为每个API开发定制化接口,例如查询天气需对接气象局API,访问数据库需单独编写连接代码。这种"点对点"集成导致开发效率低下,维护成本激增,形成"N×M"的兼容性难题。 -
数据孤岛与上下文孤立
\quad AI模型受限于训练时的静态数据,无法动态获取实时信息(如最新股价或用户历史行为)。另外,不同模型间缺乏统一的通信语言,导致跨领域协作困难,例如文本生成模型无法直接调用图像模型生成配图。 -
开发门槛高与安全风险
\quad 开发者需同时精通AI模型与工具接口开发,且传统方案缺乏统一的安全机制,敏感数据易暴露。
\quad 为了解决这些问题,Anthropic发布了一篇文章:《Introducing the Model Context Protocol》,首次提出了模型上下文协议(即MCP),通过标准化协议,让AI模型像"即插即用"的USB-C设备一样连接任意工具与数据源,实现"一次开发,全网通用"的效果。
(原文地址:https://www.anthropic.com/news/model-context-protocol)
二、MCP发展历程
\quad MCP的诞生是AI从"单机智能"迈向"生态协作"的关键转折:
- 2023年:OpenAI推出Function Calling功能,允许模型调用预设工具,但受限于厂商专有接口,生态割裂。
- 2024年11月:Anthropic正式提出MCP协议,借鉴软件工程中的语言服务器协议(LSP)和USB-C设计理念,提出首个AI领域通用交互标准。
- 2025年:行业爆发式增长。微软将MCP集成至Azure OpenAI服务,GitHub开源与MCP兼容的代码管理工具,中国东方超算发布第三方MCP服务平台"东方六合"。
- 当前生态:当前,全球已有超5000个MCP服务器,涵盖数据库、物联网、设计工具等领域,形成"AI应用商店"雏形。
三、MCP概念介绍
1. 定义
\quad 模型上下文协议(Model Context Protocol, MCP)是AI模型与外部系统交互的标准化框架,通过统一通信规范(如JSON-RPC 2.0)实现跨模型、跨工具的互操作。其核心价值在于:
- 动态上下文传递:将任务目标、输入数据、中间结果封装为结构化信息流。
- 双向协作能力:支持模型主动发起请求或响应外部指令,例如AI助手可调用GitHub服务器提交代码,同时接收代码审查反馈。
2. 核心架构
- MCP Host:用户直接交互的应用程序(如Claude Desktop、VS Code),负责发起请求。
- MCP Client:运行于Host内部的通信代理,管理服务器连接与协议解析。
- MCP Server :轻量级服务程序,提供具体能力(如文件读写、API调用),支持本地或云端部署。
3. 与Function Calling的区别

四、MCP框架流程
以一个"智能旅行规划"场景为例,解析MCP的工作流程:
- 需求输入
\quad 用户向Host发送请求:"帮我规划五一北京三日游,包含景点预约和酒店预订"。 - 上下文构建
\quad Host通过MCP Client拉取相关服务器清单(如携程酒店API、故宫门票系统、地图导航工具),并将工具说明、用户历史偏好整合为结构化提示。 - 模型决策
\quad AI模型解析需求,生成标准化指令:
json
{
"action": "book_hotel",
"params": {"city": "北京", "date": "2025-05-01", "budget": 500},
"next_step": "reserve_ticket"
}
- 指令执行
\quad MCP Client将指令分发至对应服务器:- 酒店服务器返回可选列表并自动预订
- 门票系统检查库存并生成预约码
- 地图工具规划景点间路线
- 结果整合
\quad Host汇总各服务器返回数据,生成包含行程表、预订确认函的最终报告,并支持用户通过自然语言交互调整方案。
结语
\quad MCP正在重构AI的协作范式,其意义堪比互联网时代的HTTP协议。随着生态的成熟,未来可能出现"AI联邦网络"------模型、工具、数据在开放协议下自由组合,形成真正意义上的"群体智能"。开发者与用户都应关注这一变革:前者可快速接入生态红利,后者将见证AI从"对话玩具"蜕变为"生产力伙伴"。
关注犬余,共同进步
技术从此不孤单