paddlehub搭建ocr服务

搭建环境:

  • Ubuntu20.04
  • 1080Ti显卡

由于GPU硬件比较老,是Pascal架构,只能支持到paddle2.4.2版本,更高版本无法支持;同时,因为paddle老版本的依赖发生了变化,有些地方存在冲突,花费了不少时间解决!

1. 安装GPU支持的cuda版本

这里选择的是cuda_12.0.0_525.60.13_linux.run

2. 安装对应的cudnn包

libcudnn8_8.8.0.121-1+cuda12.0_amd64.deb (从nvidia官网下载的cudnn local repo包中提取)

3. 安装对应的nccl包

libnccl2_2.19.3-1+cuda12.0_amd64.deb (从nvidia官网下载的nccl local repo包中提取)

注意:以上两个包默认安装在了/usr/lib/x86_64-linux-gnu目录下,需要在/usr/local/cuda/lib64中建立链接。如:

复制代码
sudo ln -s /usr/lib/x86_64-linux-gnu/libnccl.so libnccl.so

4. 安装miniconda,略

5. 创建虚拟环境

复制代码
conda create -n paddle python=3.8

conda activate paddle

6. 安装paddlepaddle

复制代码
conda install paddlepaddle-gpu==2.4.2 cudatoolkit=11.7 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge

pip install paddlehub -i https://pypi.tuna.tsinghua.edu.cn/simple

注:由于paddlepaddle与paddlehub之间存在版本依赖冲突问题,运行时会报错,可以执行以下命令,降低降低paddlenlp版本

复制代码
pip install paddlenlp==2.5.0 shapely pyclipper -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install protobuf==3.20.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

7. 以服务方式运行

复制代码
hub serving start -m ch_pp_ocrv3
hub serving start -m chinese_ocr_db_crnn_server

如果有多张显卡,可以指定用哪张卡来运行:

复制代码
CUDA_VISIBLE_DEVICES=1 hub serving start -m chinese_ocr_db_crnn_server

可以通过以下方式访问服务

http://127.0.0.1:8866/gradio/ch_pp_ocrv3 访问web

http://127.0.0.1:8866/predict/ch_pp-ocrv3 访问API

python 复制代码
# coding: utf8
import requests
import json
import cv2
import base64

def cv2_to_base64(image):
    data = cv2.imencode('.jpg', image)[1]
    return base64.b64encode(data.tobytes()).decode('utf8')

# 发送HTTP请求
data = {'images':[cv2_to_base64(cv2.imread("/home/zoon/Downloads/3.png"))]}
headers = {"Content-type": "application/json"}
url = "http://127.0.0.1:8866/predict/chinese_ocr_db_crnn_server"
r = requests.post(url=url, headers=headers, data=json.dumps(data))

# 打印预测结果
print(r.json()["results"])
相关推荐
模型启动机14 小时前
DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案
人工智能·ai·大模型·ocr
AI人工智能+15 小时前
车辆合格证识别技术:通过计算机视觉与自然语言处理的深度融合,解决了传统人工录入效率低、易出错的问题
深度学习·ocr·车辆合格证识别
AI人工智能+2 天前
专利证书识别技术;通过计算机视觉与深度学习,实现了专利文档从纸质到结构化数据的智能转换
深度学习·ocr·专利证书识别
hixiong1232 天前
C# OpenvinoSharp部署DDDDOCR验证码识别模型
opencv·c#·ocr·openvino
阿里巴巴P8资深技术专家2 天前
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
ai·ocr·ai大模型·rag·文档解析·mineru·tike
今天也不想动2 天前
如何将NotebookLM PDF版PPT转为可编辑版本PPT
ocr·ppt·notebooklm
Chunyyyen2 天前
【第三十周】OCR学习03
学习·ocr
Mr -老鬼2 天前
EasyclickOCR模块的正确用法
ocr·easyclick
钟良堂3 天前
Java开发OCR(自动识别图片中的文字)Tesseract-OCR + Tess4J 和 百度智能云OCR API
java·ocr·图片文字识别
qq_546937273 天前
PDF工具的天花板!PDF补丁丁:开源免费+无广告,支持Win7~Win11,批量OCR秒完成
pdf·ocr