PP-StructureV3 开启高性能模式转onnx 报错和找不到hpi_model_info_collection.json

报错内容:

Model files already exist. Using cached files. To redownload, please delete the directory manually: `/home/fugubiao/.paddlex/official_models/SLANet_plus`.

Bucketed engine_config has no entry for resolved engine 'hpi'; using an empty config for that engine.

Automatically converting PaddlePaddle model to ONNX format

Inference backend: onnxruntime

Inference backend config: cpu_num_threads=10

...

RuntimeError: Node (Loop.0) Op (Loop) [TypeInferenceError] Graph attribute inferencing failed: Node:Loop.0 Output:p2o.pd_op.logical_and.0.0 [ShapeInferenceError] Mismatch between number of inferred and declared dimensions. inferred=1 declared=0

因为开启高性能模式enable_hpi=True 时会将模型转为onnx格式,这里的表格模型在转为onnx时候会报错。

我 的做法我在网上找已经转好onnx的模型打补丁。

RapidTable · 模型库

中存在我需要的模型:slanet-plus.onnx

至于这个模型的名称是你指定的哪一个:

python 复制代码
pipeline = PPStructureV3(
        wired_table_structure_recognition_model_name="SLANet_plus")

你也可以手动复制入C:/Users/你的用户名/.paddlex/official_models/SLANet_plus

我是在docker-compose.yaml直接丢进去。

python 复制代码
volumes:
      - ./patches/models/SLANet_plus/inference.onnx:/root/.paddlex/official_models/SLANet_plus/inference.onnx 

另外我相信有一部分人会遇到缺失hpi_model_info_collection.json的错误:

FileNotFoundError: [Errno 2] No such file or directory: '/home/fugubiao/app/anaconda3/envs/paddle310/lib/python3.10/site-packages/paddlex/inference/models/runners/hpi/hpi_model_info_collection.json'

在官方PaddleX将源码down下来,一样打补丁就好了

python 复制代码
volumes:
      - ./patches/runners:/usr/local/lib/python3.10/site-packages/paddlex/inference/models/runners

最后吐槽一下Paddlex 缺失这些文件真的很致命。

相关推荐
XM_jhxx6 小时前
AI图纸识别 vs 传统OCR:差距在哪里?
人工智能·ocr
weixin_4080996715 小时前
触动精灵调用身份证OCR识别API实现智能信息录入(Lua脚本实战)
junit·ocr·lua·自动化脚本·石榴智能·身份证ocr识别·触动精灵
kevin 11 天前
财报OCR识别怎么做,银行授信场景下,如何把财报录入从3小时提效至5分钟
ocr
tanis_20772 天前
扫描版中文 PDF 怎么提取文字:用 MinerU 做 OCR + 结构化一体处理
人工智能·pdf·ocr
largecode2 天前
怎么让每个连锁店的分店手机打出去都显示品牌名?申请多号码企业认证业务
百度·智能手机·微信公众平台·facebook·twitter·paddle·新浪微博
tanis_20772 天前
学术论文 PDF 的版面自动还原:MinerU 对多栏排版、浮动图表与脚注区域的识别实战
人工智能·pdf·ocr
largecode2 天前
单位电话打出去,怎么在号码上显示出单位名称?办理号码认证操作指南
其他·百度·oneapi·twitter·paddle·segmentfault·微信开放平台
weixin_408099672 天前
按键精灵如何调用身份证OCR接口做实名录入自动化(带完整脚本代码)
自动化·ocr·按键精灵·身份证ocr·石榴智能·ocr api·脚本自动化
AI人工智能+3 天前
文档抽取系统通过OCR与大语言模型融合技术,将非结构化文档(如合同、保单、表格)自动转换为结构化数据
人工智能·语言模型·ocr·文档抽取