Paddle分布式训练报NCCL错

应该是没有装NCCL,但是通过NVIDIA官网方式用apt安装报错,说nccl签名有问题

打开官网查找对应版本的nccl:https://developer.nvidia.com/nccl/nccl-legacy-downloads

这里不下载local Ubuntu选项,下载O/S agnostic local installer这个选项

下载到本地后上传到服务器中,目录自己选

然后解压

tar -xvf nccl-xxxx.tar

解压完进入文件夹,把nccl复制过去

sudo cp include/* /usr/local/cuda/include
sudo cp lib/* /usr/local/cuda/lib64

然后把路径追加到环境变量中就可以了

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:你自己上边解压的路径在哪就写什么
例如:export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/nccl_2.22.3-1+cuda10.0_ppc64le/lib

参考:https://blog.csdn.net/qq_41475067/article/details/123086190?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword\~default-0-123086190-blog-143115894.235^v43^pc_blog_bottom_relevance_base9\&spm=1001.2101.3001.4242.1\&utm_relevant_index=3

相关推荐
Dragon水魅2 天前
Ubuntu22.04安装paddle GPU版本
paddle
塞大花5 天前
PDF文件提取开源工具调研总结
pdf·ocr·paddlepaddle·paddle·pdf文件提取·pdf内容识别
北落师门XY7 天前
paddle——站在巨人肩膀上及背刺二三事
paddle
Mia@13 天前
智能化文档开发(DI)
nlp·paddle
BlackPercy18 天前
[paddle] 非线性拟合问题的训练
python·机器学习·paddlepaddle·paddle
love you joyfully18 天前
YOLO——pytorch与paddle实现YOLO
pytorch·yolo·paddle
love you joyfully1 个月前
目标检测与R-CNN——paddle部分
人工智能·目标检测·cnn·paddle
ONE米球兔1 个月前
OCR(四)windows 环境基于c++的 paddle ocr 编译【GPU版本】
ocr·paddle
Eric.Lee20211 个月前
ubuntu paddle ocr 部署bug问题解决
ubuntu·ocr·paddle
love you joyfully1 个月前
目标检测与R-CNN——pytorch与paddle实现目标检测与R-CNN
人工智能·pytorch·目标检测·cnn·paddle