玩转计算机视觉——按照配置部署paddleOCR(英伟达环境与昇腾300IDUO环境)

英伟达环境安装

创建虚拟环境

bash 复制代码
conda create -n paddleOCR python==3.10 -y
conda activate paddleOCR

conda install jupyterlab -y
conda install ipykernel -y
python -m ipykernel install --user --name paddleOCR --display-name "paddle OCR"

下载PaddleOCR的GPU版本

下载链接: https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/windows-pip.html

选择合适的版本执行命令行下载即可

然后直接使用pip下载panddleocr

bash 复制代码
pip install  paddleocr

昇腾300IDUO源码安装

在安装前,先确保安装好了昇腾的驱动和固件,并且安装CANN

然后添加到环境变量中

bash 复制代码
export ASCEND_HOME_PATH=/usr/local/Ascend/latest
source ${ASCEND_HOME_PATH}/set_env.sh

官方安装链接: https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/82RC1alpha002/softwareinst/instg/instg_0001.html?Mode=PmIns&OS=Ubuntu&Software=cannToolKit

下载源码

通过网盘分享的文件:PaddleOCR_Ascend.zip

链接: https://pan.baidu.com/s/1XbtJKQDoj3eKY0XRS9VMzA?pwd=e519 提取码: e519

在本篇中,代码下载后解压到目录/home/PaddleOCR_Ascend

创建虚拟环境

bash 复制代码
# 创建虚拟环境
conda create -n paddleocr python=3.9 -y
conda activate paddleocr
 
pip install -r requirements.txt
pip install paddlepaddle==2.6.1 paddle2onnx==1.2.4

准备推理模型

进入源码目录

bash 复制代码
cd /home/PaddleOCR_Ascend

创建目录并下载模型

bash 复制代码
mkdir inference
cd inference
 
wget -nc https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_server_infer.tar
tar -xf ch_PP-OCRv4_det_server_infer.tar
wget -nc https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_server_infer.tar
tar -xf ch_PP-OCRv4_rec_server_infer.tar

paddle转onnx格式

bash 复制代码
paddle2onnx --model_dir inference/ch_PP-OCRv4_det_server_infer \
    --model_filename inference.pdmodel \
    --params_filename inference.pdiparams \
    --save_file inference/det/model.onnx \
    --opset_version 11 \
    --enable_onnx_checker True
 
paddle2onnx --model_dir inference/ch_PP-OCRv4_rec_server_infer \
    --model_filename inference.pdmodel \
    --params_filename inference.pdiparams \
    --save_file inference/rec/model.onnx \
    --opset_version 11 \
    --enable_onnx_checker True

安装相关依赖

bash 复制代码
sudo yum install mesa-libGL
pip install mindspore
pip install mindspore-lite[ascend] 

onnx转mindir格式

bash 复制代码
cd /home/data
# 由于我的300i duo是arm架构,因此下载对应的工具
wget https://ms-release.obs.cn-north-4.myhuaweicloud.com/2.3.0rc2/MindSpore/lite/release/linux/aarch64/cloud_fusion/python37/mindspore-lite-2.3.0rc2-linux-aarch64.tar.gz
tar -zxvf mindspore-lite-2.3.0rc2-linux-aarch64.tar.gz
# 将转换工具需要的动态链接库加入环境变量LD_LIBRARY_PATH,比如我这里装在/data/tff下
export LD_LIBRARY_PATH=/home/data/mindspore-lite-2.3.0rc2-linux-aarch64/tools/converter/lib:${LD_LIBRARY_PATH}
bash 复制代码
cd /home/data/mindspore-lite-2.3.0rc2-linux-aarch64/tools/converter/converter
./converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=/home/PaddleOCR_Ascend/inference/det/model.onnx \
    --outputFile=/home/PaddleOCR_Ascend/inference/det/model

./converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=/home/PaddleOCR_Ascend/inference/rec/model.onnx \
    --outputFile=/home/PaddleOCR_Ascend/inference/rec/model

测试

bash 复制代码
python /home/PaddleOCR_Ascend/tools/infer/predict_system.py \
  --use_mindir=True \
  --gpu_id=0 \
  --image_dir=/home/PaddleOCR_Ascend/doc/imgs/1.jpg \
  --det_model_dir=/home/PaddleOCR_Ascend/inference/det/model.mindir \
  --rec_model_dir=/home/PaddleOCR_Ascend/inference/rec/model.mindir \
  --rec_char_dict_path=/home/PaddleOCR_Ascend/ppocr/utils/ppocr_keys_v1.txt \
  --use_angle_cls=False \
  --vis_font_path=/home/PaddleOCR_Ascend/doc/fonts/simfang.ttf
相关推荐
说私域6 分钟前
基于开源链动2+1模式AI智能名片S2B2C商城小程序的赛道力构建与品牌发展研究
人工智能·小程序
喜欢吃豆1 小时前
llama.cpp 全方位技术指南:从底层原理到实战部署
人工智能·语言模型·大模型·llama·量化·llama.cpp
e6zzseo2 小时前
独立站的优势和劣势和运营技巧
大数据·人工智能
富唯智能3 小时前
移动+协作+视觉:开箱即用的下一代复合机器人如何重塑智能工厂
人工智能·工业机器人·复合机器人
Antonio9154 小时前
【图像处理】图像的基础几何变换
图像处理·人工智能·计算机视觉
新加坡内哥谈技术5 小时前
Perplexity AI 的 RAG 架构全解析:幕后技术详解
人工智能
武子康5 小时前
AI研究-119 DeepSeek-OCR PyTorch FlashAttn 2.7.3 推理与部署 模型规模与资源详细分析
人工智能·深度学习·机器学习·ai·ocr·deepseek·deepseek-ocr
智驱力人工智能6 小时前
基于视觉分析的人脸联动使用手机检测系统 智能安全管理新突破 人脸与手机行为联动检测 多模态融合人脸与手机行为分析模型
算法·安全·目标检测·计算机视觉·智能手机·视觉检测·边缘计算
Sirius Wu6 小时前
深入浅出:Tongyi DeepResearch技术解读
人工智能·语言模型·langchain·aigc
忙碌5447 小时前
AI大模型时代下的全栈技术架构:从深度学习到云原生部署实战
人工智能·深度学习·架构