安装paddle_ocr踩坑(使用PP-OCRv5_server_rec)

用途:使用最新版的PP-OCRv5_server_rec

1、首先装python版本,创建运行环境,Linux内运行

复制代码
conda create -n paddle_ocrv5 python=3.10

2、因为测试要CPU进行,于是直接使用命令

复制代码
python -m pip install paddlepaddle==3.2.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

3、已经出错,导入paddlepaddle时出现什么os(libpython3.12.so.1.0)找不到的问题,然后查找发现要升级系统(我的是python版本不对应)

,于是升级python版本到3.12,这个错就没有了。以下是正常安装流程

1、首先创建环境

复制代码
conda create -n paddle_ocrv5_cpu python=3.12

2、安装CPU版本

python -m pip install paddlepaddle==3.2.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

3、安装最新版本paddle_ocr(一定要最新,按照魔塔的介绍来)

复制代码
python -m pip install paddleocr

4、安装过程中会出现有一些库由于有些库没安装,导致安装失败,整合了一下如下

复制代码
regex>=2022.1.18
tiktoken==0.11.0
cffi>=1.0
soundfile==0.13.1
fsspec>=2023.5.0
huggingface-hub==0.34.4
click>=7.0
msgpack<2.0.0,>=1.0.0
ray==2.48.0
distro<2,>=1.7.0
openai==1.100.2
uvicorn[standard]>=0.15.0
fastapi-cloud-cli==0.1.5
shellingham>=1.3.0
typer==0.16.1
fastapi-cli==0.0.8
markupsafe

5、下载模型文件,运行以下程序,model_dir用于指定已经下载的本地文件

复制代码
from paddleocr import TextRecognition
model = TextRecognition(model_name="PP-OCRv5_server_rec", model_dir="/home/bhan/007_paddle_v5_cpu/model_files")
output = model.predict(input="image.png", batch_size=1)
for res in output:
    res.print()
    res.save_to_img(save_path="./output/")
    res.save_to_json(save_path="./output/res.json")

推理成功:

复制代码
{'res': {'input_path': 'image.png', 'page_index': None, 'rec_text': 'day as a reminder of the', 'rec_score': 0.9835110306739807}}
Connecting to https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/fonts/simfang.ttf ...
Downloading simfang.ttf ...
[==================================================] 100.00%
相关推荐
AI人工智能+2 天前
银行卡识别技术结合AI与深度学习,实现了从图像采集到结构化输出的全流程自动化处理
深度学习·计算机视觉·ocr·银行卡识别
DisonTangor2 天前
【小红书拥抱开源】rednote-hilab团队开源SOTA级性能OCR模型——dots.mocr
人工智能·计算机视觉·开源·ocr
张登杰踩5 天前
工业图像序列识别实战:基于PyTorch的OCR模型训练与优化
人工智能·pytorch·ocr
AI人工智能+5 天前
一种融合大模型微调与高精度OCR的智能文档抽取系统,实现对合同文本中关键要素的高精度语义理解与结构化抽取
人工智能·语言模型·ocr·文档抽取
余俊晖5 天前
多模态文档解析新思路:MinerU-Diffusion通过扩散解码进行文档OCR
人工智能·ocr·多模态
带娃的IT创业者5 天前
文档扫描工具开发:高拍仪硬件集成与图像处理流水线
jvm·图像处理·人工智能·ocr·文档扫描·glm-4.6v·高拍仪
skywalk81636 天前
训推一体化的AI飞桨套件:paddlex初探,还是不太顺利
开发语言·paddle
熊猫钓鱼>_>6 天前
MinerU的正确使用方式:如何解析PDF成标准化向量数据,以供AI大模型等场景应用
人工智能·阿里云·架构·pdf·ocr·skill·mineru
开开心心就好6 天前
免费自媒体多功能工具箱,图片音视频处理
人工智能·pdf·ocr·excel·音视频·语音识别·媒体
AI人工智能+7 天前
银行回单识别技术:融合计算机视觉与自然语言处理,实现对多版式回单的高精度解析
深度学习·计算机视觉·ocr·银行回单识别