SpringAI MCP模型上下文协议(七)

MCP介绍与原理

MCP(Model Context Protocol,模型上下文协议)是 Anthropic 于 2024 年 11 月推出的开放标准,旨在为大型语言模型(LLMs)提供统一接口,以便连接和调用外部数据源和工具。

目前,各大 LLM 平台(如 Deepseek、ChatGPT、Claude)普遍支持 Function Calling,允许模型在需要时调用特定函数(如访问网络、查询数据库等)来扩展能力。

MCP的核心是对大模型调用外部工具建立一个标准化流程。MCP基于 Function Calling,进一步定义了从请求构建、发送、执行到结果返回的标准化流程。通过 MCP,模型可以以统一方式与各种外部工具和数据源交互,极大提升了跨平台兼容性和 AI 应用开发效率。

MCP 与 Function Calling 的区别和联系如下:

Function Calling :是 LLM 内部定义的一组函数,通过 JSON schema 让 LLM知道有哪些功能能调用。

MCP:在 Function Calling 基础上,进一步标准化了函数调用的完整流程,包括请求的构建、发送、执行以及结果的返回。

简单来说,MCP 是对 Function Calling 的扩展与升级,实现了更高层次的抽象和更强的可扩展性。可以将 MCP 理解为 AI 世界里的"USB-C标准",为模型接入各种数据源和工具提供了统一接口,确保连接便捷且安全。

MCP 遵循客户端-服务器架构,角色主要包含三部分:

MCP Host

运行 LLM(如 Claude、ChatGPT、Deepseek)的实体节点,如果使用的LLM为线上模型,可以忽略这部分。

MCP Client

运行着与大模型对话的客户端(可能会使用工具)叫做MCP Client。其与 MCP Server 保持 1:1 连接,负责解析模型请求,如果使用工具会将请求转发到对应 MCP Server。

MCP Server

实际运行外部工具(如访问文件系统、发送邮件、查询日历)的服务端叫做MCP Server。负责处理请求并将结果返回给 Client。

MCP Cilent与MCP Server之间有两种通信机制:Stdio(标准输入/输出)和SSE(Server-Sent-Event,服务器发送事件),两种机制介绍如下:

Stdio(标准输入/输出):当服务器和客户端同时运行在本机时,可以使用Stdio机制。

SSE(Server-Sent-Event):当服务器部署在远程服务器上,客户端通过HTTP 请求发送消息使用这种方式。

MCP Java SDK 架构

上图中,McpClient处理客户端操作,McpServer管理服务端操作,两者都使用McpSession进行通信管理。传输层(Mcp Transport)负责处理JSON-RPC 消息的序列化和反序列化,支持三种传输实现:STDIO、Spring MVC SSE、Spring WebFlux SSE,三者区别如下:

STDIO:基于进程间的标准输入/输出(STDIO)传输,支持单进程,同步交互处理消息。适用于MCP 服务端和客户端都在同一节点上集成。

Spring MVC SSE(HTTP SSE):基于Spring MVC的SSE传输,支持Servlet线程池,阻塞式处理消息。适用于普通的Web应用。

Spring WebFlux SSE:官方建议方式。基于Spring WebFlux的反应式SSE,支持高并发、低延迟,响应式处理消息。适用于高并发的web微服务。

对于以上不同的传输方式,Spring AI 提供了多个启动器(starter),简化MCP在SpringBoot中的使用。

*客户端Starter:

spring-ai-starter-mcp-client:支持 STDIO 与 HTTP-SSE。

spring-ai-starter-mcp-client-webflux:基于 WebFlux 的 SSE 客户端实现。

* **服务端Starter:**

spring-ai-starter-mcp-server:支持 STDIO 传输。

spring-ai-starter-mcp-server-webmvc:基于 Spring MVC 的 SSE 服务端实现。

spring-ai-starter-mcp-server-webflux:基于 WebFlux 的 SSE 服务端实现。

相关推荐
闵孚龙1 小时前
Claude Code 缓存架构与断点设计全解析:Prompt Cache、上下文工程、Token 成本优化、AI Agent 长会话性能治理
人工智能·缓存·架构·prompt·claude
冬奇Lab1 小时前
一天一个开源项目(第102篇):NVIDIA Video Search and Summarization - 构建 GPU 加速的视觉智能体
人工智能·计算机视觉·开源
weixin_428005301 小时前
C#调用 AI学习从0开始-第1阶段(基础与工具)-第3天FewShot少样本测试
人工智能·c#
xiaozhazha_1 小时前
技术解析:如何通过AI视频会议系统,解决业务协同与CRM间的“数据管道”问题
人工智能
2zcode1 小时前
基于深度学习的车辆品牌与类型智能识别系统设计与实现
人工智能·深度学习·智能交通
小小尚@1 小时前
AI 加持!Adobe Acrobat DC 2026 解锁 PDF 高效办公新体验
人工智能·pdf
NOCSAH1 小时前
统好 AI:AI 赋能生产制造,扎实推进智改数转
人工智能·制造
Soari1 小时前
终结 AI 乱跑(Harness Engineering):深度拆解 ralph-orchestrator,构建确定性的多智能体生命周期编排流
人工智能·生命周期管理·harnesseng·多智能体编排
IT_陈寒1 小时前
被JavaScript的隐式类型转换坑到怀疑人生,记录这次离谱经历
前端·人工智能·后端