MCP快速入门—快速构建自己的服务器

引言

随着大语言模型(LLM)技术的快速发展,如何扩展其能力边界成为开发者关注的重点。MCP(Model Capability Protocol)作为一种协议标准,允许开发者构建自定义服务器来增强LLM的功能。

正文内容

1. MCP核心概念与技术背景

MCP服务器主要提供三种能力类型:

  • 资源(Resources) :客户端可读取的类似文件的数据(如API响应或文件内容)
  • 工具(Tools) :经用户批准后LLM可调用的函数
  • 提示(Prompts) :帮助用户完成特定任务的预编写模板

本教程将重点介绍工具类型的实现,通过构建两个实用工具(get-alerts和get-forecast)来扩展Claude的功能,使其能够获取天气预报和恶劣天气警报。

2. 环境准备与项目初始化

2.1 系统要求

  • Python 3.10或更高版本
  • Python MCP SDK 1.2.0或更高版本

2.2 安装uv并创建项目

bash 复制代码
# 安装uv包管理器
curl -LsSf https://astral.sh/uv/install.sh | sh

# 创建项目目录
uv init weather
cd weather

# 创建并激活虚拟环境
uv venv
source .venv/bin/activate

# 安装依赖
uv add "mcp[cli]" httpx

# 创建服务器文件
touch weather.py

3. 构建天气服务器

3.1 初始化FastMCP实例

ini 复制代码
from typing import Any
import httpx
from mcp.server.fastmcp import FastMCP

# 初始化FastMCP服务器
mcp = FastMCP("weather")

# 常量定义
NWS_API_BASE = "https://api.weather.gov"
USER_AGENT = "weather-app/1.0"
```

FastMCP类利用Python类型提示和文档字符串自动生成工具定义,简化了MCP工具的创建和维护过程。

3.2 实现辅助函数

python 复制代码
async def make_nws_request(url: str) -> dict[str, Any] | None:
    """向NWS API发起请求并处理错误"""
    headers = {
        "User-Agent": USER_AGENT,
        "Accept": "application/geo+json"
    }
    async with httpx.AsyncClient() as client:
        try:
            response = await client.get(url, headers=headers, timeout=30.0)
            response.raise_for_status()
            return response.json()
        except Exception:
            return None

def format_alert(feature: dict) -> str:
    """格式化警报特征为可读字符串"""
    props = feature["properties"]
    return f"""
Event: {props.get('event', 'Unknown')}
Area: {props.get('areaDesc', 'Unknown')}
Severity: {props.get('severity', 'Unknown')}
Description: {props.get('description', 'No description available')}
Instructions: {props.get('instruction', 'No specific instructions provided')}
"""

3.3 实现工具功能

python 复制代码
@mcp.tool()
async def get_alerts(state: str) -> str:
    """获取美国各州的天气警报
    
    Args:
        state: 两字母州代码(如CA, NY)
    """
    url = f"{NWS_API_BASE}/alerts/active/area/{state}"
    data = await make_nws_request(url)

    if not data or "features" not in data:
        return "无法获取警报或未发现警报"

    if not data["features"]:
        return "该州无活跃警报"

    alerts = [format_alert(feature) for feature in data["features"]]
    return "\n---\n".join(alerts)

@mcp.tool()
async def get_forecast(latitude: float, longitude: float) -> str:
    """获取某地天气预报
    
    Args:
        latitude: 纬度
        longitude: 经度
    """
    # 首先获取预测网格端点
    points_url = f"{NWS_API_BASE}/points/{latitude},{longitude}"
    points_data = await make_nws_request(points_url)

    if not points_data:
        return "无法获取该位置的预测数据"

    # 从points响应中获取预测URL
    forecast_url = points_data["properties"]["forecast"]
    forecast_data = await make_nws_request(forecast_url)

    if not forecast_data:
        return "无法获取详细预测"

    # 将时间段格式化为可读预测
    periods = forecast_data["properties"]["periods"]
    forecasts = []
    for period in periods[:5]:  # 仅显示接下来5个时段
        forecast = f"""
{period['name']}:
温度: {period['temperature']}°{period['temperatureUnit']}
风速: {period['windSpeed']} {period['windDirection']}
预测: {period['detailedForecast']}
"""
        forecasts.append(forecast)

    return "\n---\n".join(forecasts)

3.4 运行服务器

ini 复制代码
if __name__ == "__main__":
    # 初始化并运行服务器
    mcp.run(transport='stdio')

4. 连接Claude for Desktop进行测试

4.1 配置客户端

json 复制代码
{
  "mcpServers": {
    "weather": {
      "command": "uv",
      "args": [
        "--directory",
        "/ABSOLUTE/PATH/TO/PARENT/FOLDER/weather",
        "run",
        "weather.py"
      ]
    }
  }
}

4.2 测试命令

  • "萨克拉门托的天气怎么样?"
  • "德克萨斯州有哪些活跃的天气警报?"

5. 技术实现原理

当用户提问时,系统会经历以下流程:

  1. 客户端将问题发送给Claude
  2. Claude分析可用工具并决定使用哪些
  3. 客户端通过MCP服务器执行选定工具
  4. 结果返回给Claude
  5. Claude生成自然语言响应
  6. 向用户显示响应

结论

本文详细介绍了如何使用Python和MCP SDK快速构建一个功能完整的天气服务器。通过实现get-alerts和get-forecast两个工具,我们成功扩展了Claude的能力,使其能够查询实时天气信息。这种模式可以推广到其他领域,为LLM添加各种实用功能。MCP协议的灵活性和Python SDK的易用性使得开发者可以快速构建和集成自定义功能,极大地丰富了LLM的应用场景。

原文地址:https://www.cnblogs.com/powertoolsteam/p/18985414

相关推荐
AI大模型9 小时前
拒绝“纸上谈兵”!这本《图解大模型:生成式 AI 原理与实战》太适合入门大模型了
程序员·llm·deepseek
冯骐9 小时前
从论文提示词注入看智能体安全
安全·agent
用户35218024547511 小时前
MCP极简入门:第一个服务器DesktopCommanderMCP
ai编程·mcp
饼干哥哥11 小时前
两句话,让Claude Code + Kimi K2 跑了3小时爬完17个竞品网站、做了一份深度市场数据分析报告
数据分析·agent·ai编程
聚客AI12 小时前
⚡手撕Transformer心脏:从RoPE到2025 Meta三线性体积编码的跃迁
人工智能·pytorch·llm
智泊AI12 小时前
多模态对比学习模型CLIP原理是什么?(讲人话版)
llm
G皮T12 小时前
【人工智能】通过 Dify 构建智能助手
人工智能·ai·llm·大语言模型·dify·ai agent·智能体
大模型真好玩15 小时前
深入浅出LangChain AI Agent智能体开发教程(一)—认识LangChain&LangGraph
人工智能·python·mcp
JimmysAIPG15 小时前
从零训练大模型之模型升级版搭建及训练总结(下)
llm