先讲个故事
2024 年之前,如果你想让 ChatGPT 帮你读个本地文件,路子大概是这样:
自己写个 Python 脚本,调 OpenAI API,把文件内容拼到 prompt 里,然后看运气。
想接个数据库?再写一套对接逻辑。想调个飞书文档?又是一套。每个数据源、每个工具,都得单独写胶水代码。而且换一个模型(比如从 GPT 换到 Claude),这些胶水代码大概率还得重写。
这事儿本质上就跟 2010 年那会儿的手机充电口一样------每家厂商各搞各的,家里一堆线,出门借个充电器跟求爷爷告奶奶似的。
然后 Anthropic 在 2024 年 11 月 25 日甩出了一样东西:MCP(Model Context Protocol)。
MCP 是个啥?一句话版本
MCP 不是工具,不是应用,不是 SDK,不是 API,也不是产品------它是一个协议。
大模型跟外部世界之间的通信协议。仅此而已。
它的野心也很直白:任何一个 AI 模型,都能用同一种方式去访问外部的资源和工具。
你可以把它理解成 AI 界的 USB-C。不管你是 Claude、GPT、Gemini,还是国产大模型,只要大家都认 MCP 这套规矩,那数据源和工具就能"即插即用"。
为什么需要这玩意儿?
聊到这儿,先得搞清楚一个概念:Context Engineering(上下文工程)。
Prompt Engineering 大家都知道------怎么写提示词让模型表现更好。但 Context Engineering 往前多走了一步:不要光靠 prompt 里那点信息硬扛,而是帮模型把真正需要的上下文"工程化"地组织起来。
MCP 做的就是这件事的底座。
以前大模型回答问题是这样的:你问一句,它从预训练的知识里搜肠刮肚想一句。这撑死了叫 Chatbot。
而现在路线很明确------让模型能动起来:查最新的数据、读你的本地文件、调第三方 API、操作你的日历......这些外部信息才是让模型从"能聊天"变成"能干活"的关键。
MCP 给这一切提供了一套统一的、标准化的通信协议。你不用再为 GPT 写一套适配、再为 Claude 写一套适配,把 RAG 方案拼来凑去------MCP 直接把这个层面的问题一锅端了。
三件套:Host、Client、Server
MCP 的架构非常简洁,就三个角色:
1. MCP Host(宿主)
就是你电脑上跑的那个 AI 应用本身。比如 Claude Code、Cursor、Trae、Codex 这类 LLM 客户端。
Host 负责接收你的自然语言指令,然后推理出:"嗯,这事儿我光靠训练数据搞不定,得去问问有什么外部工具和资源可以用。"
2. MCP Client(客户端)
跑在 Host 内部,维护了一堆 MCP Server 的连接配置。你可以把每个 MCP Server 理解成一个"插件"------高德地图是一个插件,Gmail 是一个插件,本地文件系统也是一个插件。
Client 的角色类似"中间商":Host 说需要什么,Client 就去对应的 Server 那里取。
3. MCP Server(服务端)
真正提供上下文的一方。可以是:
- 本地文件系统服务(让 AI 安全读写你指定的目录)
- 数据库服务(让 AI 直接查 PostgreSQL、SQLite 等)
- 第三方 SaaS 服务(飞书文档、高德地图、Slack、Gmail......)
- 各种 API 的封装
Server 的职责就两个:(1)定义清楚自己能提供什么资源和工具;(2)按照 MCP 协议规范跟 Client 通信。
资源和工具:MCP 的两条腿
MCP Server 能给大模型提供的东西分两类:
资源(Resources)------模型想"知道"的东西。数据库里的数据、API 返回的结果、本地文件内容、飞书文档、高德地图上的 POI 信息。这些东西被标准化地暴露出来,模型可以按需读取。
工具(Tools)------模型想"做"的事情。创建日历事件、发邮件、执行命令、远程控制设备。模型不只是被动地读,而是能真正动手操作外部世界。
资源和工具加起来,就是让大模型从"嘴炮"变成"实干家"的那把钥匙。
上手试一下
说一百遍不如跑一遍。MCP 官方提供了一个文件系统服务端,安装巨简单:
bash
npm i -g @modelcontextprotocol/server-filesystem
装完之后,在你的 AI 客户端(比如 Claude Code)里配一下 .mcp.json:
json
{
"mcpServers": {
"filesystem": {
"type": "stdio",
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-filesystem",
"E:/你的工作目录"
]
}
}
}
配完之后,你就能直接在对话里让 AI 帮你读写指定目录下的文件了。它不会越界碰目录之外的任何东西------安全边界是 MCP Server 自己定义好的。
这个体验跟以前那种"自己写脚本把文件内容拼进 prompt"的蹩脚方案比起来,可以说是降维打击了。
MCP 真正改变的是什么?
如果你只是把 MCP 理解成一个"方便接工具的协议",那你只看到了一半。
它真正颠覆的地方在于:把 AI 应用架构从"提示词 + 单次回复"推到了"模型自主调度外部资源"的阶段。
这叫什么?这叫 Agentic AI(智能体 AI)。
以前我们总说 AI 是"缸中之脑"------再聪明,也只能靠训练数据里的那点东西。MCP 相当于给这个大脑接上了眼睛、耳朵和手。
它看到的不再只是你的 prompt,而是能去翻你的文件、查最新的数据、调用你授权的服务。然后基于这些实时获取的上下文来做推理和行动。
这不是量变,是质变。
最后
MCP 到现在(2025-2026)已经发展得非常快了。从 Anthropic 一家主导,到社区涌现出海量第三方 Server,从最初的文件系统、数据库,到现在几乎什么都有------地图、邮件、日历、项目管理、云服务......
如果你还没在自己的开发环境里接过 MCP Server,强烈建议现在就去试一个。哪怕只是一个文件系统 Server,你就能直观感受到那种"AI 真的在帮我干活"的体验切换。
未来已来,而且这次终于不用再写胶水代码了。