PP-OCRv5 MCP服务器在海光主板的部署与实战

在当今数字化快速发展的时代,OCR(光学字符识别)技术已经成为从图像中提取文本信息的重要工具。无论是在自动化办公、智能文档处理还是在内容创作领域,OCR 技术的应用都极大地提高了工作效率和准确性。本次评测,我们基于海光 3350 工控机作为统一计算平台,搭载 NVIDIA GeForce RTX 4070显卡,运行PaddleOCR MCP服务进行本地测试。

测试平台-配置信息

  • 板卡:海光 C86-3G-3350 主板(8核16线程,3.0-3.3GHz)
  • 内存:32GB DDR4 ECC(双通道)
  • 显卡:Nvidia Geforce RTX 4070
  • 系统盘:512/512 SATA(Win11专业版)
  • 电源:750W 80Plus
  • 大模型:Qwen3-14b、PP-OCRv5
  • 推理工具:CheryStudio

一,安装PaddleOCR_MCP库

首先,在命令提示行执行命令安装源头库

复制代码
git clone https://github.com/PaddlePaddle/PaddleOCR.git

然后再执行命令,安装MCP服务驱动:

复制代码
pip install -e mcp_server

若需验证MCP服务器安装是否成功,可输入命令

复制代码
paddleocr_mcp --help

二,在CheryStudio中使用PaddleOCR MCP服务器

首先,打开Cherry Studio在软件的"MCP服务器"管理页面,安装好UV和Bun。

然后,在Cherry Studio的"MCP服务器"管理页面,点击"+ 添加服务器-从JSON导入",填入下面的参数:

复制代码
{
"mcpServers": {
"paddleocr-ocr": {
{"mcpServers": {"paddleocr-ocr": {"command": "请注意,如果你使用的是Anaconda,请在Anaconda安装的隔离环境中输入where paddleocr_mcp来获取对应的MCP路径。否则无法使用",
"args": [],
"env": {
"PADDLEOCR_MCP_PIPELINE": "OCR",
"PADDLEOCR_MCP_PPOCR_SOURCE": "local"
}
}
}
}

最后,点击"确定"按钮,完成在Cherry Studio中,配置PaddleOCR MCP。

三,PaddleOCR MCP服务器运行

首先,启用MCP服务器输入需要进行的操作与对应的图片路径:

复制代码
根据路径"C:\test.pdf",从文档中提取文本、公式和其他信息

四,总结

借助Cherry Studio 与大模型及 PaddleOCR MCP 的深度融合,用户不仅能高效精准地从各类图像中提取文本内容,还可进一步完成结构化数据提取等复杂任务。结合 Cherry Studio 灵活的配置能力,用户可量身定制专属 AI 助手,显著提升工作效率与生活便捷性。


如果你有更好的文章,欢迎投稿!

稿件接收邮箱:++nami.liu++ ++@pasuntech++ ++.com++

更多精彩内容请关注"算力魔方"!

相关推荐
SkyWalking中文站13 小时前
认识 Horizon UI · 1/17:SkyWalking 新一代可观测性控制台
运维·前端·监控
雪梨酱QAQ16 小时前
Kubeneters HA Cluster部署
运维
江华森20 小时前
Spring Cloud 微服务全栈实战:从 Eureka 到 Docker Compose 一文贯通
运维
江华森20 小时前
Matplotlib 数据绘图基础入门
运维
江华森20 小时前
NumPy 数值计算基础入门
运维
乘云数字DATABUFF5 天前
5分钟部署开源APM Databuff:OpenTelemetry全链路追踪入门实战
运维·后端
荣--7 天前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
江华森7 天前
动手实战学 Docker — 从零到集群编排完全指南
运维
Avan_菜菜7 天前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https
SelectDB8 天前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维