【AI】MCP模型上下文协议

基于端侧模型环境，我来详细介绍 MCP（Model Context Protocol，模型上下文协议）。

MCP 是什么

维度	说明
本质	开放协议标准，用于AI模型与外部数据源/工具的双向连接
发起者	Anthropic（Claude的母公司），2024年11月开源
核心目标	让AI模型像"USB-C接口"一样，标准化接入各类数据与工具
当前状态	已成为行业事实标准，OpenAI、Google、微软等均已支持

为什么端侧模型特别需要MCP

端侧模型（手机/PC本地运行的LLM）面临的核心矛盾：

复制代码

能力 ←→ 资源
  ↑       ↓
需要工具  但无法像云端模型那样
访问数据  自由调用API（隐私/成本/延迟）

MCP解决这个断层：

标准化接口：无需为每个工具写定制集成
本地优先：MCP Server可运行在本地，数据不出设备
安全隔离：工具调用通过协议层管控，而非模型直接执行

MCP 架构（端侧视角）

复制代码

┌─────────────────────────────────────┐
│         端侧模型（Local LLM）        │
│    （如：手机NPU运行的Qwen/Phi-4）    │
└──────────────┬──────────────────────┘
               │
        ┌──────▼──────┐
        │  MCP Client │  ← 内嵌在模型推理框架中
        │  （Host）    │    （如：Ollama、LM Studio）
        └──────┬──────┘
               │
    ┌──────────┼──────────┐
    │          │          │
    ▼          ▼          ▼
┌───────┐  ┌───────┐  ┌───────┐
│MCP    │  │MCP    │  │MCP    │
│Server │  │Server │  │Server │
│- 本地文件│  │- 浏览器 │  │- 系统API │
│- 数据库 │  │- 日历  │  │- 智能家居 │
└───────┘  └───────┘  └───────┘

核心组件详解

1. MCP Host（宿主）

承载模型的应用，负责协调连接：

桌面端：Claude Desktop、Cursor、Windsurf
端侧框架：Ollama（v0.6.0+支持MCP）、llama.cpp（实验性）
移动端：iOS/Android的本地AI助手（如Enchanted、PocketPal）

2. MCP Client（客户端）

内嵌于Host中，维护与Server的1:1连接
管理工具发现 、调用执行 、上下文同步

3. MCP Server（服务端）

关键洞察：Server是独立进程，可部署在：

位置	场景	示例
本地机器	端侧模型访问本地资源	文件系统、SQLite、浏览器控制
远程服务器	需要云端算力/数据	企业知识库、专有API
沙盒环境	安全隔离	代码执行、文件操作审计

4. 传输层（Transport）

类型	适用场景	端侧适用性
Stdio	本地子进程通信	✅ 最常用，零网络依赖
SSE	远程Server流式通信	⚠️ 需网络，但低延迟
WebSocket	双向实时交互	✅ 移动端PWA场景

端侧MCP的典型应用场景

场景1：本地知识库问答

复制代码

用户提问："我上周保存的关于MCP的笔记在哪里？"

处理流程：
1. 模型通过MCP Client调用本地FileSystem Server
2. Server检索 ~/Documents/ 和 ~/Notes/ 目录
3. 返回匹配文件列表 + 内容摘要
4. 模型生成回答，引用本地文件路径

场景2：隐私优先的日程管理

复制代码

用户："下周三我有空吗？帮我约个会"

处理流程：
1. MCP Client连接本地Calendar Server（读取iOS/Outlook日历）
2. 模型分析空闲时段，**不将日历数据上传云端**
3. 生成会议建议，用户确认后通过同一Server写入

场景3：端侧代码助手

复制代码

开发者在VS Code + Ollama本地模型中工作：

"给这个函数加单元测试，并运行验证"

1. 模型通过MCP调用FileSystem Server读取代码
2. 生成测试代码，通过同一Server写入文件
3. 调用本地Terminal Server执行 `npm test`
4. 读取测试结果，反馈给用户

MCP vs 传统方案（端侧对比）

方案	集成方式	端侧适用性	问题
Function Calling	模型原生能力	✅	每个模型格式不同，工具需重复适配
插件系统	应用级扩展	⚠️	开发成本高，生态碎片化
MCP	标准化协议	✅✅	一次适配，多模型通用

端侧关键优势 ：MCP Server可用任何语言编写，与模型Host解耦：

Python数据分析Server
Rust高性能文件索引Server
Swift iOS系统API桥接Server

技术实现细节（端侧开发视角）

Server开发（Python示例）

python 复制代码

# server.py - 本地文件检索Server
from mcp.server import Server
from mcp.types import Tool, TextContent
import os

server = Server("local-filesystem")

@server.list_tools()
async def list_tools():
    return [
        Tool(
            name="search_notes",
            description="搜索本地笔记文件",
            inputSchema={
                "type": "object",
                "properties": {
                    "query": {"type": "string"},
                    "path": {"type": "string", "default": "~/Notes"}
                }
            }
        )
    ]

@server.call_tool()
async def call_tool(name, arguments):
    if name == "search_notes":
        results = local_search(arguments["query"], arguments["path"])
        return [TextContent(type="text", text=results)]

与端侧模型连接（Ollama配置）

json 复制代码

// ollama_mcp_config.json
{
  "mcpServers": {
    "filesystem": {
      "command": "python",
      "args": ["server.py"],
      "transport": "stdio"
    },
    "browser": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-puppeteer"],
      "transport": "stdio"
    }
  }
}

当前生态与工具

类别	代表项目	端侧适用性
官方Server	文件系统、SQLite、Git、Puppeteer	✅ 全部本地运行
社区Server	智能家居（Home Assistant）、本地LLM管理	✅ 隐私优先
框架SDK	Python SDK、TypeScript SDK、Kotlin SDK	✅ 支持移动端开发
可视化工具	MCP Inspector（调试Server）、Claude Desktop Config	✅ 本地调试

端侧MCP的挑战与未来

挑战	现状	演进方向
移动能耗	Server进程增加耗电	轻量级Rust实现、按需唤醒
安全边界	本地Server权限过大	细粒度权限模型、用户确认层
发现机制	需手动配置Server	自动发现、应用商店式Server市场
多模态	当前以文本为主	图像、音频、传感器数据标准化

一句话总结

MCP是端侧AI的"USB-C"------它让本地运行的模型能够安全、标准、灵活地接入你的文件、应用和物理世界，而无需牺牲隐私或等待云端。