PP-StructureV3 开启高性能模式转onnx 报错和找不到hpi_model_info_collection.json

报错内容:

Model files already exist. Using cached files. To redownload, please delete the directory manually: `/home/fugubiao/.paddlex/official_models/SLANet_plus`.

Bucketed engine_config has no entry for resolved engine 'hpi'; using an empty config for that engine.

Automatically converting PaddlePaddle model to ONNX format

Inference backend: onnxruntime

Inference backend config: cpu_num_threads=10

...

RuntimeError: Node (Loop.0) Op (Loop) TypeInferenceError Graph attribute inferencing failed: Node:Loop.0 Output:p2o.pd_op.logical_and.0.0 ShapeInferenceError Mismatch between number of inferred and declared dimensions. inferred=1 declared=0

因为开启高性能模式enable_hpi=True 时会将模型转为onnx格式,这里的表格模型在转为onnx时候会报错。

我 的做法我在网上找已经转好onnx的模型打补丁。

RapidTable · 模型库

中存在我需要的模型:slanet-plus.onnx

至于这个模型的名称是你指定的哪一个:

python 复制代码
pipeline = PPStructureV3(
        wired_table_structure_recognition_model_name="SLANet_plus")

你也可以手动复制入C:/Users/你的用户名/.paddlex/official_models/SLANet_plus

我是在docker-compose.yaml直接丢进去。

python 复制代码
volumes:
      - ./patches/models/SLANet_plus/inference.onnx:/root/.paddlex/official_models/SLANet_plus/inference.onnx 

另外我相信有一部分人会遇到缺失hpi_model_info_collection.json的错误:

FileNotFoundError: Errno 2 No such file or directory: '/home/fugubiao/app/anaconda3/envs/paddle310/lib/python3.10/site-packages/paddlex/inference/models/runners/hpi/hpi_model_info_collection.json'

在官方PaddleX将源码down下来,一样打补丁就好了

python 复制代码
volumes:
      - ./patches/runners:/usr/local/lib/python3.10/site-packages/paddlex/inference/models/runners

最后吐槽一下Paddlex 缺失这些文件真的很致命。

相关推荐
Sour3 天前
PDF翻译卡住不动怎么办?扫描件、OCR 和大文件排查清单
前端·pdf·ocr
旗讯数字4 天前
旗讯 OCR 工业手写识别解决方案|破解车间纸质表单录入难题,加速生产数字化转型
大数据·ocr
XTIOT6664 天前
多形态护照 OCR 读取器传输机制、识别算法与行业落地技术对比
大数据·人工智能·嵌入式硬件·物联网·ocr
天天代码码天天4 天前
用 TensorRT 加速 PP-OCR:一套 C++ DLL + C# 调用的高性能 OCR 推理方案
c++·c#·ocr
2401_885665195 天前
基于OpenCV的模板匹配OCR实战:银行卡与身份证数字识别完整教程
人工智能·python·opencv·计算机视觉·ocr
东集Seuic5 天前
食品标签新规 GB 7718-2025 倒计时:产线“首件检验”如何用东集小码哥CRUISE Ge2-M跑通 OCR 智能核对?
大数据·人工智能·ocr
小鹏linux5 天前
鸿蒙PC迁移:Tesseract OCR C++ 三方库鸿蒙适配全记录
c++·ocr·harmonyos
开开心心就好5 天前
自动生成小学数学题库支持导出Word
人工智能·安全·leetcode·贪心算法·ocr·音视频·语音识别
FL16238631296 天前
基于C#winform使用纯opencv部署ppocrv5和ppocrv6的onnx模型进行OCR文件检测识别
opencv·c#·ocr
AI人工智能+6 天前
智能文档抽取系统以专业的文档解析底座和大模型智能语义理解能力为核心,洞察文档的语义内涵与逻辑结构
深度学习·自然语言处理·ocr·文档抽取