如何用OpenVINO™部署PP-StructureV3到Intel GPU上

一,RapidDoc系统概述

RapidDoc是一个轻量级、专注于文档解析的开源框架,支持OCR、版面分析、公式识别、表格识别和阅读顺序恢复等多种功能。框架基于 Mineru 二次开发,移除 VLM,专注于 Pipeline 产线下的高效文档解析,在 CPU 上也能保持不错的解析速度。本文章所使用的核心模型主要来源于 PaddleOCR 的 PP-StructureV3 系列(OCR、版面分析、公式识别、阅读顺序恢复,以及部分表格识别模型),并已全部转换为 ONNX 格式,支持在 CPU/GPU 上高效推理。

二,开始部署

首先,在命令提示行执行命令下载源文件。

复制代码
git clone https://github.com/chrisma-2025/RapidDoc-OpenVINO

然后再执行命令,安装python依赖包

复制代码
pip install torch torchvision --index-url https://download.pytorch.org/whl/cpu
pip install loguru pypdfium2 requests boto3 pydantic pypdf reportlab magika opencv-python tqdm omegaconf colorlog tokenizers rapidocr fast_langdetect scikit-image bs4 pdfminer pdfminer.six pdftext matplotlib
pip install onnxruntime-openvino onnxruntime
pip install --pre openvino --extra-index-url https://storage.openvinotoolkit.org/simple/wheels/nightly

下载OCR模型并使用指令将模型转换为OpenVINO™支持的IR文件

复制代码
cd RapidDoc-OpenVINO/models
wget https://www.modelscope.cn/models/RapidAI/RapidOCR/resolve/master/onnx/PP-OCRv5/det/ch_PP-OCRv5_server_det.onnx -P ocr
wget https://www.modelscope.cn/models/RapidAI/RapidOCR/resolve/master/onnx/PP-OCRv5/rec/ch_PP-OCRv5_rec_server_infer.onnx -P ocr
wget https://www.modelscope.cn/models/RapidAI/RapidOCR/resolve/master/onnx/PP-OCRv4/cls/ch_ppocr_mobile_v2.0_cls_infer.onnx -P ocr

下载完成后运行:python ir_converter.py

三,运行Demo

执行命令返回文件根目

复制代码
cd ..

Python demo.py

如何用OpenVINO™部署PP-StructureV3到I

四,总结

本文完整演示了基于RapidDoc 框架的文档解析工具落地流程:先克隆源码、安装 PyTorch/OpenVINO 等依赖,再下载 PP-OCRv5 系列 ONNX 模型并尝试转换为 IR 文件,最后通过demo.py验证部署效果。

实际运行中,Intel GPU(Arc A770、Iris Xe Graphics)可正常调用,稳定完成多页面文档的 OCR、版面分析等任务,此次部署既验证了 RapidDoc 框架在轻量化工单解析场景的实用性,也证实了 OpenVINO™ 对 Inte GPU 的适配性,为后续工业、金融等领域的文档智能解析需求提供了可复用的技术方案。

如果你有更好的文章,欢迎投稿!

稿件接收邮箱:nami.liu@pasuntech.com

更多精彩内容请关注"算力魔方®"!

相关推荐
学电子她就能回来吗几秒前
深度学习速成:模型的使用与修改,保存与读取
人工智能·深度学习
友思特 智能感知3 分钟前
友思特案例 | 金属行业视觉检测案例四:挖掘机钢板表面光学字符识别(OCR)检测
人工智能·视觉检测·深度学习视觉检测
爱吃泡芙的小白白6 分钟前
CNN激活函数新篇:Sigmoid与Softmax的进化与实战
人工智能·神经网络·cnn·softmax·sigmoid·函数激活层
星爷AG I11 分钟前
9-27 视觉表象(AGI基础理论)
人工智能·agi
Coder_Boy_12 分钟前
基于SpringAI的在线考试系统-企业级教育考试系统核心架构(完善版)
开发语言·人工智能·spring boot·python·架构·领域驱动
艾莉丝努力练剑12 分钟前
【Linux:文件】基础IO:文件操作的系统调用和库函数各个接口汇总及代码演示
linux·运维·服务器·c++·人工智能·centos·io
Leinwin18 分钟前
VibeVoice-ASR:突破60分钟长音频处理瓶颈,语音识别进入端到端时代
人工智能·音视频·语音识别
Godspeed Zhao22 分钟前
从零开始学AI7——机器学习0
人工智能·机器学习
Dev7z22 分钟前
基于深度学习的肺音分类算法研究
人工智能·深度学习
dingzd9523 分钟前
AI 代理购物落地后,真正的“增量岗位”叫——商品数据工程
大数据·人工智能·跨境电商·内容营销·跨境