一篇搞懂 MCP：大模型的"USB-C 接口"到底是个啥

先讲个故事

2024 年之前，如果你想让 ChatGPT 帮你读个本地文件，路子大概是这样：

自己写个 Python 脚本，调 OpenAI API，把文件内容拼到 prompt 里，然后看运气。

想接个数据库？再写一套对接逻辑。想调个飞书文档？又是一套。每个数据源、每个工具，都得单独写胶水代码。而且换一个模型（比如从 GPT 换到 Claude），这些胶水代码大概率还得重写。

这事儿本质上就跟 2010 年那会儿的手机充电口一样------每家厂商各搞各的，家里一堆线，出门借个充电器跟求爷爷告奶奶似的。

然后 Anthropic 在 2024 年 11 月 25 日甩出了一样东西：MCP（Model Context Protocol）。

MCP 是个啥？一句话版本

MCP 不是工具，不是应用，不是 SDK，不是 API，也不是产品------它是一个协议。

大模型跟外部世界之间的通信协议。仅此而已。

它的野心也很直白：任何一个 AI 模型，都能用同一种方式去访问外部的资源和工具。

你可以把它理解成 AI 界的 USB-C。不管你是 Claude、GPT、Gemini，还是国产大模型，只要大家都认 MCP 这套规矩，那数据源和工具就能"即插即用"。

为什么需要这玩意儿？

聊到这儿，先得搞清楚一个概念：Context Engineering（上下文工程）。

Prompt Engineering 大家都知道------怎么写提示词让模型表现更好。但 Context Engineering 往前多走了一步：不要光靠 prompt 里那点信息硬扛，而是帮模型把真正需要的上下文"工程化"地组织起来。

MCP 做的就是这件事的底座。

以前大模型回答问题是这样的：你问一句，它从预训练的知识里搜肠刮肚想一句。这撑死了叫 Chatbot。

而现在路线很明确------让模型能动起来：查最新的数据、读你的本地文件、调第三方 API、操作你的日历......这些外部信息才是让模型从"能聊天"变成"能干活"的关键。

MCP 给这一切提供了一套统一的、标准化的通信协议。你不用再为 GPT 写一套适配、再为 Claude 写一套适配，把 RAG 方案拼来凑去------MCP 直接把这个层面的问题一锅端了。

三件套：Host、Client、Server

MCP 的架构非常简洁，就三个角色：

1. MCP Host（宿主）

就是你电脑上跑的那个 AI 应用本身。比如 Claude Code、Cursor、Trae、Codex 这类 LLM 客户端。

Host 负责接收你的自然语言指令，然后推理出："嗯，这事儿我光靠训练数据搞不定，得去问问有什么外部工具和资源可以用。"

2. MCP Client（客户端）

跑在 Host 内部，维护了一堆 MCP Server 的连接配置。你可以把每个 MCP Server 理解成一个"插件"------高德地图是一个插件，Gmail 是一个插件，本地文件系统也是一个插件。

Client 的角色类似"中间商"：Host 说需要什么，Client 就去对应的 Server 那里取。

3. MCP Server（服务端）

真正提供上下文的一方。可以是：

本地文件系统服务（让 AI 安全读写你指定的目录）
数据库服务（让 AI 直接查 PostgreSQL、SQLite 等）
第三方 SaaS 服务（飞书文档、高德地图、Slack、Gmail......）
各种 API 的封装

Server 的职责就两个：（1）定义清楚自己能提供什么资源和工具；（2）按照 MCP 协议规范跟 Client 通信。

资源和工具：MCP 的两条腿

MCP Server 能给大模型提供的东西分两类：

资源（Resources）------模型想"知道"的东西。数据库里的数据、API 返回的结果、本地文件内容、飞书文档、高德地图上的 POI 信息。这些东西被标准化地暴露出来，模型可以按需读取。

工具（Tools）------模型想"做"的事情。创建日历事件、发邮件、执行命令、远程控制设备。模型不只是被动地读，而是能真正动手操作外部世界。

资源和工具加起来，就是让大模型从"嘴炮"变成"实干家"的那把钥匙。

上手试一下

说一百遍不如跑一遍。MCP 官方提供了一个文件系统服务端，安装巨简单：

bash 复制代码

npm i -g @modelcontextprotocol/server-filesystem

装完之后，在你的 AI 客户端（比如 Claude Code）里配一下 .mcp.json：

json 复制代码

{
  "mcpServers": {
    "filesystem": {
      "type": "stdio",
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-filesystem",
        "E:/你的工作目录"
      ]
    }
  }
}

配完之后，你就能直接在对话里让 AI 帮你读写指定目录下的文件了。它不会越界碰目录之外的任何东西------安全边界是 MCP Server 自己定义好的。

这个体验跟以前那种"自己写脚本把文件内容拼进 prompt"的蹩脚方案比起来，可以说是降维打击了。

MCP 真正改变的是什么？

如果你只是把 MCP 理解成一个"方便接工具的协议"，那你只看到了一半。

它真正颠覆的地方在于：把 AI 应用架构从"提示词 + 单次回复"推到了"模型自主调度外部资源"的阶段。

这叫什么？这叫 Agentic AI（智能体 AI）。

以前我们总说 AI 是"缸中之脑"------再聪明，也只能靠训练数据里的那点东西。MCP 相当于给这个大脑接上了眼睛、耳朵和手。

它看到的不再只是你的 prompt，而是能去翻你的文件、查最新的数据、调用你授权的服务。然后基于这些实时获取的上下文来做推理和行动。

这不是量变，是质变。

最后

MCP 到现在（2025-2026）已经发展得非常快了。从 Anthropic 一家主导，到社区涌现出海量第三方 Server，从最初的文件系统、数据库，到现在几乎什么都有------地图、邮件、日历、项目管理、云服务......

如果你还没在自己的开发环境里接过 MCP Server，强烈建议现在就去试一个。哪怕只是一个文件系统 Server，你就能直观感受到那种"AI 真的在帮我干活"的体验切换。

未来已来，而且这次终于不用再写胶水代码了。