提示:可在python环境中进行安装,避免环境污染,创建命令conda create -n xxx_name python=3.9,激活conda activate xxx_name
第一步:查看计算机平台版本
在窗口输入查看命令,查看CUDA的版本
nvidia-smi
data:image/s3,"s3://crabby-images/5624e/5624ecbf40f1f3356bfe6019a51eaa7858f60f20" alt=""
二、根据以下条件进行选择自动生成安装命令:
快速安装路径:飞桨PaddlePaddle-源于产业实践的开源深度学习平台
data:image/s3,"s3://crabby-images/daa1e/daa1eff970a361b520a4789017092eb116e36fef" alt=""
三、踩坑记录:
1.AttributeError: 'ParallelEnv' object has no attribute '_device_id'
data:image/s3,"s3://crabby-images/31c3f/31c3f836db78b582c5857010e3d0ce9d5e8c9fa8" alt=""
解决方法:paddle 2.6.0及以上版本中,应使用dist.get_world_size()
代替dist.ParallelEnv().nranks
,并且应使用dist.get_rank()
代替dist.ParallelEnv().local_rank.
即定位到program.py的677行将内容更改成如下所示:
data:image/s3,"s3://crabby-images/1e0ff/1e0ff1e31d5a9c90ff4cc5e6c66ddef9b92e7958" alt=""
2.ImportError: libcudart.so.11.0: cannot open shared object file: No such file or directory
data:image/s3,"s3://crabby-images/f4a16/f4a16dc9b254e0b6ba179399b3aac0823837be89" alt=""
解决方法:首先查看' libcudart.so.11.0'该文件是否存在:
【命令】 find 【路径】-name libcudart.so.11.0
例如: find /home/hadoop -name libcudart.so.11.0,结果显示:
data:image/s3,"s3://crabby-images/1282c/1282cb7e95410d477d9c5ef8e051ed9ebc451c45" alt=""
选择结果中其中一个进行环境变量修改:
【命令】export LD_LIBRARY_PATH= /home/hadoop/xxx/data/lib/libcudart.so.11.0
【命令】source ~/.bashrc
重新运行Python,无错误显示即可
data:image/s3,"s3://crabby-images/28eb6/28eb60c00b04f32b8cd3fe3688dc0c71ed5a1d1e" alt=""
补充:常用的镜像源
清华:https://pypi.tuna.tsinghua.edu.cn/simple/
阿里云:http://mirrors.aliyun.com/pypi/simple/
中国科技大学:https://pypi.mirrors.ustc.edu.cn/simple/
华中科技大学:http://pypi.hustunique.com/simple/
上海交通大学:https://mirror.sjtu.edu.cn/pypi/web/simple/
豆瓣:http://pypi.douban.com/simple/
安装方式:
pip install <安装包> -i <镜像源>
例如: pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple/