玩转计算机视觉——按照配置部署paddleOCR(英伟达环境与昇腾300IDUO环境)

英伟达环境安装

创建虚拟环境

bash 复制代码
conda create -n paddleOCR python==3.10 -y
conda activate paddleOCR

conda install jupyterlab -y
conda install ipykernel -y
python -m ipykernel install --user --name paddleOCR --display-name "paddle OCR"

下载PaddleOCR的GPU版本

下载链接: https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/windows-pip.html

选择合适的版本执行命令行下载即可

然后直接使用pip下载panddleocr

bash 复制代码
pip install  paddleocr

昇腾300IDUO源码安装

在安装前,先确保安装好了昇腾的驱动和固件,并且安装CANN

然后添加到环境变量中

bash 复制代码
export ASCEND_HOME_PATH=/usr/local/Ascend/latest
source ${ASCEND_HOME_PATH}/set_env.sh

官方安装链接: https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/82RC1alpha002/softwareinst/instg/instg_0001.html?Mode=PmIns&OS=Ubuntu&Software=cannToolKit

下载源码

通过网盘分享的文件:PaddleOCR_Ascend.zip

链接: https://pan.baidu.com/s/1XbtJKQDoj3eKY0XRS9VMzA?pwd=e519 提取码: e519

在本篇中,代码下载后解压到目录/home/PaddleOCR_Ascend

创建虚拟环境

bash 复制代码
# 创建虚拟环境
conda create -n paddleocr python=3.9 -y
conda activate paddleocr
 
pip install -r requirements.txt
pip install paddlepaddle==2.6.1 paddle2onnx==1.2.4

准备推理模型

进入源码目录

bash 复制代码
cd /home/PaddleOCR_Ascend

创建目录并下载模型

bash 复制代码
mkdir inference
cd inference
 
wget -nc https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_server_infer.tar
tar -xf ch_PP-OCRv4_det_server_infer.tar
wget -nc https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_server_infer.tar
tar -xf ch_PP-OCRv4_rec_server_infer.tar

paddle转onnx格式

bash 复制代码
paddle2onnx --model_dir inference/ch_PP-OCRv4_det_server_infer \
    --model_filename inference.pdmodel \
    --params_filename inference.pdiparams \
    --save_file inference/det/model.onnx \
    --opset_version 11 \
    --enable_onnx_checker True
 
paddle2onnx --model_dir inference/ch_PP-OCRv4_rec_server_infer \
    --model_filename inference.pdmodel \
    --params_filename inference.pdiparams \
    --save_file inference/rec/model.onnx \
    --opset_version 11 \
    --enable_onnx_checker True

安装相关依赖

bash 复制代码
sudo yum install mesa-libGL
pip install mindspore
pip install mindspore-lite[ascend] 

onnx转mindir格式

bash 复制代码
cd /home/data
# 由于我的300i duo是arm架构,因此下载对应的工具
wget https://ms-release.obs.cn-north-4.myhuaweicloud.com/2.3.0rc2/MindSpore/lite/release/linux/aarch64/cloud_fusion/python37/mindspore-lite-2.3.0rc2-linux-aarch64.tar.gz
tar -zxvf mindspore-lite-2.3.0rc2-linux-aarch64.tar.gz
# 将转换工具需要的动态链接库加入环境变量LD_LIBRARY_PATH,比如我这里装在/data/tff下
export LD_LIBRARY_PATH=/home/data/mindspore-lite-2.3.0rc2-linux-aarch64/tools/converter/lib:${LD_LIBRARY_PATH}
bash 复制代码
cd /home/data/mindspore-lite-2.3.0rc2-linux-aarch64/tools/converter/converter
./converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=/home/PaddleOCR_Ascend/inference/det/model.onnx \
    --outputFile=/home/PaddleOCR_Ascend/inference/det/model

./converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=/home/PaddleOCR_Ascend/inference/rec/model.onnx \
    --outputFile=/home/PaddleOCR_Ascend/inference/rec/model

测试

bash 复制代码
python /home/PaddleOCR_Ascend/tools/infer/predict_system.py \
  --use_mindir=True \
  --gpu_id=0 \
  --image_dir=/home/PaddleOCR_Ascend/doc/imgs/1.jpg \
  --det_model_dir=/home/PaddleOCR_Ascend/inference/det/model.mindir \
  --rec_model_dir=/home/PaddleOCR_Ascend/inference/rec/model.mindir \
  --rec_char_dict_path=/home/PaddleOCR_Ascend/ppocr/utils/ppocr_keys_v1.txt \
  --use_angle_cls=False \
  --vis_font_path=/home/PaddleOCR_Ascend/doc/fonts/simfang.ttf
相关推荐
吴佳浩6 分钟前
Python入门指南-AI模型相似性检测方法:技术原理与实现
人工智能·python·llm
kebijuelun24 分钟前
百度文心 4.5 大模型详解:ERNIE 4.5 Technical Report
人工智能·深度学习·百度·语言模型·自然语言处理·aigc
算家计算31 分钟前
ComfyUI-v0.3.43本地部署教程:新增 Omnigen 2 支持,复杂图像任务一步到位!
人工智能·开源
新智元36 分钟前
毕业 7 年,身价破亿!清北 AI 天团血洗硅谷,奥特曼被逼分天价股份
人工智能·openai
新智元1 小时前
刚刚,苹果大模型团队负责人叛逃 Meta!华人 AI 巨星 + 1,年薪飙至 9 位数
人工智能·openai
Cyltcc1 小时前
如何安装和使用 Claude Code 教程 - Windows 用户篇
人工智能·claude·visual studio code
吹风看太阳2 小时前
机器学习16-总体架构
人工智能·机器学习
moonsims2 小时前
全国产化行业自主无人机智能处理单元-AI飞控+通信一体化模块SkyCore-I
人工智能·无人机
MUTA️2 小时前
ELMo——Embeddings from Language Models原理速学
人工智能·语言模型·自然语言处理
海豚调度2 小时前
Linux 基金会报告解读:开源 AI 重塑经济格局,有人失业,有人涨薪!
大数据·人工智能·ai·开源