一篇搞懂 MCP:大模型的"USB-C 接口"到底是个啥

先讲个故事

2024 年之前,如果你想让 ChatGPT 帮你读个本地文件,路子大概是这样:

自己写个 Python 脚本,调 OpenAI API,把文件内容拼到 prompt 里,然后看运气。

想接个数据库?再写一套对接逻辑。想调个飞书文档?又是一套。每个数据源、每个工具,都得单独写胶水代码。而且换一个模型(比如从 GPT 换到 Claude),这些胶水代码大概率还得重写。

这事儿本质上就跟 2010 年那会儿的手机充电口一样------每家厂商各搞各的,家里一堆线,出门借个充电器跟求爷爷告奶奶似的。

然后 Anthropic 在 2024 年 11 月 25 日甩出了一样东西:MCP(Model Context Protocol)

MCP 是个啥?一句话版本

MCP 不是工具,不是应用,不是 SDK,不是 API,也不是产品------它是一个协议。

大模型跟外部世界之间的通信协议。仅此而已。

它的野心也很直白:任何一个 AI 模型,都能用同一种方式去访问外部的资源和工具。

你可以把它理解成 AI 界的 USB-C。不管你是 Claude、GPT、Gemini,还是国产大模型,只要大家都认 MCP 这套规矩,那数据源和工具就能"即插即用"。

为什么需要这玩意儿?

聊到这儿,先得搞清楚一个概念:Context Engineering(上下文工程)

Prompt Engineering 大家都知道------怎么写提示词让模型表现更好。但 Context Engineering 往前多走了一步:不要光靠 prompt 里那点信息硬扛,而是帮模型把真正需要的上下文"工程化"地组织起来。

MCP 做的就是这件事的底座。

以前大模型回答问题是这样的:你问一句,它从预训练的知识里搜肠刮肚想一句。这撑死了叫 Chatbot。

而现在路线很明确------让模型能动起来:查最新的数据、读你的本地文件、调第三方 API、操作你的日历......这些外部信息才是让模型从"能聊天"变成"能干活"的关键。

MCP 给这一切提供了一套统一的、标准化的通信协议。你不用再为 GPT 写一套适配、再为 Claude 写一套适配,把 RAG 方案拼来凑去------MCP 直接把这个层面的问题一锅端了。

三件套:Host、Client、Server

MCP 的架构非常简洁,就三个角色:

1. MCP Host(宿主)

就是你电脑上跑的那个 AI 应用本身。比如 Claude Code、Cursor、Trae、Codex 这类 LLM 客户端。

Host 负责接收你的自然语言指令,然后推理出:"嗯,这事儿我光靠训练数据搞不定,得去问问有什么外部工具和资源可以用。"

2. MCP Client(客户端)

跑在 Host 内部,维护了一堆 MCP Server 的连接配置。你可以把每个 MCP Server 理解成一个"插件"------高德地图是一个插件,Gmail 是一个插件,本地文件系统也是一个插件。

Client 的角色类似"中间商":Host 说需要什么,Client 就去对应的 Server 那里取。

3. MCP Server(服务端)

真正提供上下文的一方。可以是:

  • 本地文件系统服务(让 AI 安全读写你指定的目录)
  • 数据库服务(让 AI 直接查 PostgreSQL、SQLite 等)
  • 第三方 SaaS 服务(飞书文档、高德地图、Slack、Gmail......)
  • 各种 API 的封装

Server 的职责就两个:(1)定义清楚自己能提供什么资源和工具;(2)按照 MCP 协议规范跟 Client 通信。

资源和工具:MCP 的两条腿

MCP Server 能给大模型提供的东西分两类:

资源(Resources)------模型想"知道"的东西。数据库里的数据、API 返回的结果、本地文件内容、飞书文档、高德地图上的 POI 信息。这些东西被标准化地暴露出来,模型可以按需读取。

工具(Tools)------模型想"做"的事情。创建日历事件、发邮件、执行命令、远程控制设备。模型不只是被动地读,而是能真正动手操作外部世界。

资源和工具加起来,就是让大模型从"嘴炮"变成"实干家"的那把钥匙。

上手试一下

说一百遍不如跑一遍。MCP 官方提供了一个文件系统服务端,安装巨简单:

bash 复制代码
npm i -g @modelcontextprotocol/server-filesystem

装完之后,在你的 AI 客户端(比如 Claude Code)里配一下 .mcp.json

json 复制代码
{
  "mcpServers": {
    "filesystem": {
      "type": "stdio",
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-filesystem",
        "E:/你的工作目录"
      ]
    }
  }
}

配完之后,你就能直接在对话里让 AI 帮你读写指定目录下的文件了。它不会越界碰目录之外的任何东西------安全边界是 MCP Server 自己定义好的。

这个体验跟以前那种"自己写脚本把文件内容拼进 prompt"的蹩脚方案比起来,可以说是降维打击了。

MCP 真正改变的是什么?

如果你只是把 MCP 理解成一个"方便接工具的协议",那你只看到了一半。

它真正颠覆的地方在于:把 AI 应用架构从"提示词 + 单次回复"推到了"模型自主调度外部资源"的阶段。

这叫什么?这叫 Agentic AI(智能体 AI)

以前我们总说 AI 是"缸中之脑"------再聪明,也只能靠训练数据里的那点东西。MCP 相当于给这个大脑接上了眼睛、耳朵和手。

它看到的不再只是你的 prompt,而是能去翻你的文件、查最新的数据、调用你授权的服务。然后基于这些实时获取的上下文来做推理和行动。

这不是量变,是质变。

最后

MCP 到现在(2025-2026)已经发展得非常快了。从 Anthropic 一家主导,到社区涌现出海量第三方 Server,从最初的文件系统、数据库,到现在几乎什么都有------地图、邮件、日历、项目管理、云服务......

如果你还没在自己的开发环境里接过 MCP Server,强烈建议现在就去试一个。哪怕只是一个文件系统 Server,你就能直观感受到那种"AI 真的在帮我干活"的体验切换。

未来已来,而且这次终于不用再写胶水代码了。

相关推荐
玉宇夕落5 小时前
MCP协议深度剖析,从“ChatBot”到“Agentic AI”的跃迁
mcp
小小坦克手1 天前
BlenderMCP 服务崩溃诊断与修复实录
mcp
QCC产品中心1 天前
MiniMax Agent 接入实测:企业查询、股权穿透与 UBO 识别(附 Prompt 模板)
大数据·mcp·金融/非金融
ServBay2 天前
7 个AI开发中真正用得上的 MCP Server,配合Claude Code食用效果更佳
后端·claude·mcp
小七-七牛开发者2 天前
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding
leeyi2 天前
MCP 工具集成:外部工具变 Eino Tool
aigc·agent·mcp
Flynt2 天前
配置Chrome DevTools MCP,我在Windows上折腾了两个晚上
ai编程·claude·mcp
Java陈序员3 天前
企业级!一个基于 Java 开发的开源 AI 应用开发平台!
spring boot·agent·mcp
Flynt3 天前
接手28万行遗留代码:我用codebase-memory-mcp把代码理解时间从3天压到2小时
ai编程·claude·mcp