Paddle分布式训练报NCCL错

应该是没有装NCCL,但是通过NVIDIA官网方式用apt安装报错,说nccl签名有问题

打开官网查找对应版本的nccl:https://developer.nvidia.com/nccl/nccl-legacy-downloads

这里不下载local Ubuntu选项,下载O/S agnostic local installer这个选项

下载到本地后上传到服务器中,目录自己选

然后解压

复制代码
tar -xvf nccl-xxxx.tar

解压完进入文件夹,把nccl复制过去

复制代码
sudo cp include/* /usr/local/cuda/include
sudo cp lib/* /usr/local/cuda/lib64

然后把路径追加到环境变量中就可以了

复制代码
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:你自己上边解压的路径在哪就写什么
例如:export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/nccl_2.22.3-1+cuda10.0_ppc64le/lib

参考:https://blog.csdn.net/qq_41475067/article/details/123086190?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword\~default-0-123086190-blog-143115894.235^v43^pc_blog_bottom_relevance_base9\&spm=1001.2101.3001.4242.1\&utm_relevant_index=3

相关推荐
天天代码码天天1 天前
lw.PPOCRSharp_GPU_Test paddle_inference v3.3
人工智能·深度学习·paddle
weixin_462446233 天前
使用 PaddleOCR + 多进程 + GPU 加速实现 PDF 可搜索化(支持中英文、竖排/旋转文字)
pdf·paddle·识别
FL16238631293 天前
Windows上GPU版本的Paddle Inference3.2.1安装和使用教程
windows·paddle
YQ_015 天前
Ubuntu 18.04 离线安装 CUDA 11.2 + cuDNN 8.2 (修复 Paddle 缺少 .so 报错)
linux·ubuntu·paddle
AI街潜水的八角10 天前
基于paddle框架的MobileNetV2深度学习神经网络番茄/西红柿叶子病虫害识别系统源码
深度学习·神经网络·paddle
weixin_4569042716 天前
基于Yolov11,Paddle,Zxing进行目标检测文本条码识别的环境配置记录
yolo·目标检测·paddle
skywalk81631 个月前
Paddle for MD 飞桨分子动力学模拟科学计算
paddle·分子动力学·paddlemd
Alphapeople1 个月前
安装paddle
paddle
算力魔方AIPC1 个月前
通过 PaddleOCR CLI 安装并启动 vLLM
ocr·paddle·vllm·paddle ocr·算力魔方