MCP 服务器配置:让 AI 助手直接解析 PDF 文档

给 Claude Desktop / Cursor 配置MinerU MCP Server,对它说"帮我读取这个 PDF",它就调用 MinerU 解析。


MinerU 是什么

MinerU 是上海人工智能实验室开源的文档解析工具,可以把 PDF、Word、PPT、图片转换成 Markdown、JSON 等结构化格式。

最近团队发布了 MinerU2.5-Pro (2026年4月),在 OmniDocBench v1.6 基准上拿到了 95.69 分 ,刷新生态最好成绩。更难得的是,这个成绩是在 1.2B 参数小体量下达成的,参数量不到同类方案的 1/200,纯靠数据工程驱动。

MinerU 的核心能力:

能力 说明
版面分析 多栏识别、阅读顺序、页眉页脚过滤
文本识别 109 种语言 OCR
公式识别 复杂数学公式转 LaTeX
表格提取 PDF 表格结构化输出
图片处理 图表、嵌入图像、内容保留

没有 GPU?没关系,MinerU 提供云端 API(mineru.net),不用自己部署,直接调用。MCP Server 让 AI 助手直接调用 MinerU,零配置实现"对话即解析"。


什么是 MCP

MCP(Model Context Protocol)是 AI 助手调用外部工具的标准协议。配置好后,Claude/Cursor 等 MCP 兼容的 AI 客户端就能直接调用 MinerU 解析 PDF。


最快启动:uvx(无需安装)

只要你的电脑装了 uv(Python 包管理器),就能直接跑,不需要单独安装 MCP Server:

bash 复制代码
uvx mineru-open-mcp

这条命令会启动 MCP Server,后续在 AI 客户端里配置连接方式即可。


配置 AI 客户端

Claude Desktop(stdio 模式,推荐)

编辑配置文件:

  • macOS~/Library/Application Support/Claude/claude_desktop_config.json
  • Windows%APPDATA%\Claude\claude_desktop_config.json
json 复制代码
{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "你的token"
      }
    }
  }
}

重启 Claude Desktop,即可使用。

Cursor(stdio 模式)

编辑:~/.cursor/mcp.json(macOS)或 %USERPROFILE%\.cursor\mcp.json(Windows):

json 复制代码
{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "你的token"
      }
    }
  }
}

Windsurf(stdio 模式)

配置文件:~/.windsurf/mcp.json

json 复制代码
{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "你的token"
      }
    }
  }
}

streamable-http 模式(需要自己部署 Server)

启动 Server

bash 复制代码
MINERU_API_TOKEN=你的token mineru-open-mcp --transport streamable-http --port 8001

客户端配置

json 复制代码
{
  "mcpServers": {
    "mineru": {
      "type": "streamableHttp",
      "url": "http://127.0.0.1:8001/mcp"
    }
  }
}

这种模式适合:多个 AI 客户端共享一个 MCP Server,或者需要远程调用时使用。


Flash 模式 vs 精准模式

Flash(免登录) 精准(需要 Token)
身份验证 无需 Token 需要 MINERU_API_TOKEN
文件限制 20 页 / 10 MB 600 页 / 200 MB
输出格式 仅 Markdown Markdown + Word + HTML + LaTeX
适用场景 快速预览 正式使用

配置了 MINERU_API_TOKEN 环境变量后,自动切换到精准模式。


可用工具

配置成功后,你可以在 AI 对话中直接调用:

parse_documents

解析本地文件或远程 URL:

bash 复制代码
请帮我读取 /path/to/document.pdf 的内容
bash 复制代码
请提取 https://example.com/paper.pdf 的主要内容

支持格式:PDF、DOCX、PPTX、JPG、PNG、HTML。

get_ocr_languages

查询 MinerU 支持的 OCR 语言:

bash 复制代码
MinerU 支持哪些语言的 OCR?

环境变量说明

变量 说明 默认值
MINERU_API_TOKEN API Token,精准模式必需 ---(Flash 模式可选)
OUTPUT_DIR 解析结果保存目录 ~/mineru-downloads
ENABLE_LOG 开启日志 false
MINERU_LOG_DIR 日志目录 ~/.mineru-open-mcp/logs/

进阶:日志调试

开启日志:

json 复制代码
{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "你的token",
        "ENABLE_LOG": "true",
        "MINERU_LOG_DIR": "/Users/you/mineru-logs"
      }
    }
  }
}

日志文件位置:~/.mineru-open-mcp/logs/log_<timestamp>.txt


相关链接

相关推荐
程序员鱼皮3 小时前
太秀了,我把自己蒸馏成了 Skill!已开源
ai·程序员·开源·编程·ai编程
Duran.L3 小时前
从限购到畅通:GLM-5.1 Coding Plan接入攻略
人工智能·ai·软件工程·个人开发·ai编程
小程故事多_803 小时前
AI Coding 工程化革命,Superpowers 管流程,ui-ux-pro-max 管质感
人工智能·ui·架构·aigc·ai编程·ux·claude code
陈佬昔没带相机3 小时前
AI 编程更可控,GitHub 亲生子 Spec-kit 带给你优秀的 SDD 体验
ai编程
路飞说AI4 小时前
Error: socksio package not installed 完美解决方案
ai编程·claudecode
踩着两条虫4 小时前
VTJ.PRO AI + 低代码实战:接入高德地图
前端·vue.js·ai编程
摆烂工程师4 小时前
教你如何查询 Codex 最新额度是多少,以及 ChatGPT Pro、Plus、Business 最新额度变化
前端·后端·ai编程
火柴-人4 小时前
我用 C++ 写了个 MCP ,让 AI 看懂了每一帧 GPU 在画什么
图形渲染·claude·codex·skill·vulkan·mcp·renderdoc
路飞说AI4 小时前
Claude Code WebFetch:Unable to verify domain 快速解决
ai编程·claudecode·webfetch