把PP-OCRv5_server模型转换为OpenVINO格式

培根芝士2026-01-24 10:36

PP-OCRv5_server 是 PaddleOCR（百度飞桨）在 PP-OCRv5 系列里偏"服务器端/高精度"定位的一套 OCR 模型组合，核心特点是：精度更高、模型更大、算力开销更高，更适合部署在服务器、工作站等资源相对充足的环境中，用于高质量文字识别任务。

PP-OCRv5_server_det：文本检测（从图片中找到文字区域）
PP-OCRv5_server_ rec：文本识别（对检测到的文字区域进行逐行识别，输出文字内容）

1、安装paddle2onnx：

bash 复制代码

pip install --pre paddlepaddle==3.0.0.dev20250428 -i https://www.paddlepaddle.org.cn/packages/nightly/cpu/
pip install paddle2onnx 
# 安装openvino
pip install openvino

2、下载PP-OCRv5_server模型：

模型下载地址：

https://www.modelscope.cn/models/PaddlePaddle/PP-OCRv5_server_det

https://www.modelscope.cn/models/PaddlePaddle/PP-OCRv5_server_rec

3、模型转换：

Paddle → ONNX 转换

使用paddle2onnx将PP-OCRv5_server_det转换为onnx格式：

bash 复制代码

paddle2onnx --model_dir E:\BaiduNetdiskDownload\gameskill\models\PP-OCRv5_server_det --model_filename inference.json --params_filename inference.pdiparams --save_file model.onnx

转换完成后生成：model.onnx

ONNX → OpenVINO IR 转换

用 OpenVINO 的 ovc（OpenVINO Model Converter）把 ONNX 模型转换成 OpenVINO IR，输入形状动态高宽、开启 FP16 压缩、输出为指定文件名的 XML。

bash 复制代码

ovc ../model.onnx --input "x[1,3,-1,-1]" --compress_to_fp16 --output_model det_v5_model.xml

参数说明：

x[1,3,-1,-1]：表示输入为 NCHW，batch=1，3通道，H/W 动态
--compress_to_fp16：将权重压缩为 FP16，减小体积、提升某些设备性能
输出为：det_v5_model.xml（同时生成同名 .bin）