PP-StructureV3 开启高性能模式转onnx 报错和找不到hpi_model_info_collection.json

报错内容:

Model files already exist. Using cached files. To redownload, please delete the directory manually: `/home/fugubiao/.paddlex/official_models/SLANet_plus`.

Bucketed engine_config has no entry for resolved engine 'hpi'; using an empty config for that engine.

Automatically converting PaddlePaddle model to ONNX format

Inference backend: onnxruntime

Inference backend config: cpu_num_threads=10

...

RuntimeError: Node (Loop.0) Op (Loop) TypeInferenceError Graph attribute inferencing failed: Node:Loop.0 Output:p2o.pd_op.logical_and.0.0 ShapeInferenceError Mismatch between number of inferred and declared dimensions. inferred=1 declared=0

因为开启高性能模式enable_hpi=True 时会将模型转为onnx格式,这里的表格模型在转为onnx时候会报错。

我 的做法我在网上找已经转好onnx的模型打补丁。

RapidTable · 模型库

中存在我需要的模型:slanet-plus.onnx

至于这个模型的名称是你指定的哪一个:

python 复制代码
pipeline = PPStructureV3(
        wired_table_structure_recognition_model_name="SLANet_plus")

你也可以手动复制入C:/Users/你的用户名/.paddlex/official_models/SLANet_plus

我是在docker-compose.yaml直接丢进去。

python 复制代码
volumes:
      - ./patches/models/SLANet_plus/inference.onnx:/root/.paddlex/official_models/SLANet_plus/inference.onnx 

另外我相信有一部分人会遇到缺失hpi_model_info_collection.json的错误:

FileNotFoundError: Errno 2 No such file or directory: '/home/fugubiao/app/anaconda3/envs/paddle310/lib/python3.10/site-packages/paddlex/inference/models/runners/hpi/hpi_model_info_collection.json'

在官方PaddleX将源码down下来,一样打补丁就好了

python 复制代码
volumes:
      - ./patches/runners:/usr/local/lib/python3.10/site-packages/paddlex/inference/models/runners

最后吐槽一下Paddlex 缺失这些文件真的很致命。

相关推荐
EntyIU1 天前
mineru从安装部署到测试使用完整指南
python·ocr
OCR_133716212751 天前
技术解读:国内第一梯队 OCR 大模型现状与技术路线分析
ocr
AI人工智能+1 天前
赋能智慧监管:基于深度学习的特种行业许可证全要素精准识别系统
计算机视觉·自然语言处理·ocr·特种行业许可证识别
AI人工智能+1 天前
施工许可证智能识别系统通过融合计算机视觉与自然语言处理技术,实现了建筑行业关键证件的自动化信息提取
人工智能·深度学习·计算机视觉·ocr·施工许可证识别
王莎莎-MinerU2 天前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
庖丁AI2 天前
PDF表格提取工具怎么选?普通转换、OCR和解析工具的区别
pdf·ocr
weixin_397574092 天前
食品包装AI质检系统技术实现:从OCR提取到合规检测全链路
人工智能·ocr
OCR_133716212753 天前
2026大模型OCR横向测评:百度、腾讯、DeepSeek等主流模型选型对比
百度·ocr
AI人工智能+3 天前
医疗器械经营许可证识别技术通过深度学习与OCR技术实现高效资质审核
自然语言处理·ocr·医疗器械经营许可证识别
tedcloud1234 天前
RTK部署教程:构建稳定的AI Workflow环境
服务器·javascript·人工智能·typescript·ocr