安装paddle_ocr踩坑(使用PP-OCRv5_server_rec)

用途:使用最新版的PP-OCRv5_server_rec

1、首先装python版本,创建运行环境,Linux内运行

复制代码
conda create -n paddle_ocrv5 python=3.10

2、因为测试要CPU进行,于是直接使用命令

复制代码
python -m pip install paddlepaddle==3.2.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

3、已经出错,导入paddlepaddle时出现什么os(libpython3.12.so.1.0)找不到的问题,然后查找发现要升级系统(我的是python版本不对应)

,于是升级python版本到3.12,这个错就没有了。以下是正常安装流程

1、首先创建环境

复制代码
conda create -n paddle_ocrv5_cpu python=3.12

2、安装CPU版本

python -m pip install paddlepaddle==3.2.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

3、安装最新版本paddle_ocr(一定要最新,按照魔塔的介绍来)

复制代码
python -m pip install paddleocr

4、安装过程中会出现有一些库由于有些库没安装,导致安装失败,整合了一下如下

复制代码
regex>=2022.1.18
tiktoken==0.11.0
cffi>=1.0
soundfile==0.13.1
fsspec>=2023.5.0
huggingface-hub==0.34.4
click>=7.0
msgpack<2.0.0,>=1.0.0
ray==2.48.0
distro<2,>=1.7.0
openai==1.100.2
uvicorn[standard]>=0.15.0
fastapi-cloud-cli==0.1.5
shellingham>=1.3.0
typer==0.16.1
fastapi-cli==0.0.8
markupsafe

5、下载模型文件,运行以下程序,model_dir用于指定已经下载的本地文件

复制代码
from paddleocr import TextRecognition
model = TextRecognition(model_name="PP-OCRv5_server_rec", model_dir="/home/bhan/007_paddle_v5_cpu/model_files")
output = model.predict(input="image.png", batch_size=1)
for res in output:
    res.print()
    res.save_to_img(save_path="./output/")
    res.save_to_json(save_path="./output/res.json")

推理成功:

复制代码
{'res': {'input_path': 'image.png', 'page_index': None, 'rec_text': 'day as a reminder of the', 'rec_score': 0.9835110306739807}}
Connecting to https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/fonts/simfang.ttf ...
Downloading simfang.ttf ...
[==================================================] 100.00%
相关推荐
Sour4 天前
PDF翻译卡住不动怎么办?扫描件、OCR 和大文件排查清单
前端·pdf·ocr
旗讯数字4 天前
旗讯 OCR 工业手写识别解决方案|破解车间纸质表单录入难题,加速生产数字化转型
大数据·ocr
XTIOT6664 天前
多形态护照 OCR 读取器传输机制、识别算法与行业落地技术对比
大数据·人工智能·嵌入式硬件·物联网·ocr
天天代码码天天4 天前
用 TensorRT 加速 PP-OCR:一套 C++ DLL + C# 调用的高性能 OCR 推理方案
c++·c#·ocr
2401_885665195 天前
基于OpenCV的模板匹配OCR实战:银行卡与身份证数字识别完整教程
人工智能·python·opencv·计算机视觉·ocr
东集Seuic5 天前
食品标签新规 GB 7718-2025 倒计时:产线“首件检验”如何用东集小码哥CRUISE Ge2-M跑通 OCR 智能核对?
大数据·人工智能·ocr
小鹏linux5 天前
鸿蒙PC迁移:Tesseract OCR C++ 三方库鸿蒙适配全记录
c++·ocr·harmonyos
开开心心就好5 天前
自动生成小学数学题库支持导出Word
人工智能·安全·leetcode·贪心算法·ocr·音视频·语音识别
FL16238631296 天前
基于C#winform使用纯opencv部署ppocrv5和ppocrv6的onnx模型进行OCR文件检测识别
opencv·c#·ocr
AI人工智能+7 天前
智能文档抽取系统以专业的文档解析底座和大模型智能语义理解能力为核心,洞察文档的语义内涵与逻辑结构
深度学习·自然语言处理·ocr·文档抽取