PP-OCRv5 MCP服务器在海光主板的部署与实战

在当今数字化快速发展的时代,OCR(光学字符识别)技术已经成为从图像中提取文本信息的重要工具。无论是在自动化办公、智能文档处理还是在内容创作领域,OCR 技术的应用都极大地提高了工作效率和准确性。本次评测,我们基于海光 3350 工控机作为统一计算平台,搭载 NVIDIA GeForce RTX 4070显卡,运行PaddleOCR MCP服务进行本地测试。

测试平台-配置信息

  • 板卡:海光 C86-3G-3350 主板(8核16线程,3.0-3.3GHz)
  • 内存:32GB DDR4 ECC(双通道)
  • 显卡:Nvidia Geforce RTX 4070
  • 系统盘:512/512 SATA(Win11专业版)
  • 电源:750W 80Plus
  • 大模型:Qwen3-14b、PP-OCRv5
  • 推理工具:CheryStudio

一,安装PaddleOCR_MCP库

首先,在命令提示行执行命令安装源头库

复制代码
git clone https://github.com/PaddlePaddle/PaddleOCR.git

然后再执行命令,安装MCP服务驱动:

复制代码
pip install -e mcp_server

若需验证MCP服务器安装是否成功,可输入命令

复制代码
paddleocr_mcp --help

二,在CheryStudio中使用PaddleOCR MCP服务器

首先,打开Cherry Studio在软件的"MCP服务器"管理页面,安装好UV和Bun。

然后,在Cherry Studio的"MCP服务器"管理页面,点击"+ 添加服务器-从JSON导入",填入下面的参数:

复制代码
{
"mcpServers": {
"paddleocr-ocr": {
{"mcpServers": {"paddleocr-ocr": {"command": "请注意,如果你使用的是Anaconda,请在Anaconda安装的隔离环境中输入where paddleocr_mcp来获取对应的MCP路径。否则无法使用",
"args": [],
"env": {
"PADDLEOCR_MCP_PIPELINE": "OCR",
"PADDLEOCR_MCP_PPOCR_SOURCE": "local"
}
}
}
}

最后,点击"确定"按钮,完成在Cherry Studio中,配置PaddleOCR MCP。

三,PaddleOCR MCP服务器运行

首先,启用MCP服务器输入需要进行的操作与对应的图片路径:

复制代码
根据路径"C:\test.pdf",从文档中提取文本、公式和其他信息

四,总结

借助Cherry Studio 与大模型及 PaddleOCR MCP 的深度融合,用户不仅能高效精准地从各类图像中提取文本内容,还可进一步完成结构化数据提取等复杂任务。结合 Cherry Studio 灵活的配置能力,用户可量身定制专属 AI 助手,显著提升工作效率与生活便捷性。


如果你有更好的文章,欢迎投稿!

稿件接收邮箱:++nami.liu++ ++@pasuntech++ ++.com++

更多精彩内容请关注"算力魔方"!

相关推荐
kk57915 小时前
ubuntu20.04运行todesk显示网络连接异常无网络
linux·运维·服务器
福大大架构师每日一题15 小时前
nginx 1.29.4 发布:支持 HTTP/2 后端与加密客户端问候(ECH),多项功能优化与修复
运维·nginx·http
晴天¥15 小时前
Oracle中的表空间
运维·数据库·oracle
中科米堆15 小时前
汽车制造厂采用自动化三维扫描系统,将抽检升级为全检-中科米堆CASAIM
运维·自动化·汽车·3d全尺寸检测
幸存者letp15 小时前
为什么 max(words, key=len) 中需要传 key=len
服务器·开发语言·c#
郝学胜-神的一滴15 小时前
Linux下创建线程:从入门到实践
linux·服务器·开发语言·c++·程序人生·软件工程
我命由我1234515 小时前
Python Flask 开发 - Flask 路径参数类型(string、int、float、path、uuid)
服务器·开发语言·后端·python·flask·学习方法·python3.11
QT 小鲜肉15 小时前
【Linux命令大全】001.文件管理之chown命令(实操篇)
linux·运维·服务器·笔记
爱宇阳16 小时前
宝塔面板 + Nginx + Spring Boot 零停机滚动发布完整教程
运维·spring boot·nginx