PP-OCRv5 MCP服务器在海光主板的部署与实战

在当今数字化快速发展的时代,OCR(光学字符识别)技术已经成为从图像中提取文本信息的重要工具。无论是在自动化办公、智能文档处理还是在内容创作领域,OCR 技术的应用都极大地提高了工作效率和准确性。本次评测,我们基于海光 3350 工控机作为统一计算平台,搭载 NVIDIA GeForce RTX 4070显卡,运行PaddleOCR MCP服务进行本地测试。

测试平台-配置信息

  • 板卡:海光 C86-3G-3350 主板(8核16线程,3.0-3.3GHz)
  • 内存:32GB DDR4 ECC(双通道)
  • 显卡:Nvidia Geforce RTX 4070
  • 系统盘:512/512 SATA(Win11专业版)
  • 电源:750W 80Plus
  • 大模型:Qwen3-14b、PP-OCRv5
  • 推理工具:CheryStudio

一,安装PaddleOCR_MCP库

首先,在命令提示行执行命令安装源头库

复制代码
git clone https://github.com/PaddlePaddle/PaddleOCR.git

然后再执行命令,安装MCP服务驱动:

复制代码
pip install -e mcp_server

若需验证MCP服务器安装是否成功,可输入命令

复制代码
paddleocr_mcp --help

二,在CheryStudio中使用PaddleOCR MCP服务器

首先,打开Cherry Studio在软件的"MCP服务器"管理页面,安装好UV和Bun。

然后,在Cherry Studio的"MCP服务器"管理页面,点击"+ 添加服务器-从JSON导入",填入下面的参数:

复制代码
{
"mcpServers": {
"paddleocr-ocr": {
{"mcpServers": {"paddleocr-ocr": {"command": "请注意,如果你使用的是Anaconda,请在Anaconda安装的隔离环境中输入where paddleocr_mcp来获取对应的MCP路径。否则无法使用",
"args": [],
"env": {
"PADDLEOCR_MCP_PIPELINE": "OCR",
"PADDLEOCR_MCP_PPOCR_SOURCE": "local"
}
}
}
}

最后,点击"确定"按钮,完成在Cherry Studio中,配置PaddleOCR MCP。

三,PaddleOCR MCP服务器运行

首先,启用MCP服务器输入需要进行的操作与对应的图片路径:

复制代码
根据路径"C:\test.pdf",从文档中提取文本、公式和其他信息

四,总结

借助Cherry Studio 与大模型及 PaddleOCR MCP 的深度融合,用户不仅能高效精准地从各类图像中提取文本内容,还可进一步完成结构化数据提取等复杂任务。结合 Cherry Studio 灵活的配置能力,用户可量身定制专属 AI 助手,显著提升工作效率与生活便捷性。


如果你有更好的文章,欢迎投稿!

稿件接收邮箱:++nami.liu++ ++@pasuntech++ ++.com++

更多精彩内容请关注"算力魔方"!

相关推荐
liuhuizuikeai23 分钟前
可视化门禁---Linux/Qt+SqLite篇
linux·运维·qt
charlie1145141913 小时前
嵌入式Linux驱动开发——新 API 字符设备驱动完整教程 - 从设备结构体到应用测试
linux·运维·驱动开发
飞Link4 小时前
2000 亿砸向算力:字节跳动 AI 基建跨越,后端与运维的“万亿 Token”生死战
运维·人工智能
SWAGGY..4 小时前
Linux系统编程:(二)基础指令详解
linux·运维·服务器
张文君5 小时前
上古世纪服务端编译安装AAEmu docker编译安装
运维·docker·容器
蜡笔婧萱5 小时前
Linux--远程登录服务ssh
linux·服务器·ssh
雾岛心情5 小时前
小铭邮件管理工具箱的界面(公司版)
运维·服务器·工具·o365·小铭邮件工具箱(公司版)
一只鹿鹿鹿5 小时前
数据库运维与管理规范(WORD)
运维·数据库
伏加特遇上西柚6 小时前
Loki+Alloy+Grafana日志采集部署
java·linux·服务器·spring boot·grafana·prometheus
zl_dfq6 小时前
服务器设计细节 之 【eventfd、struct stat、stat接口】
服务器