Paddle分布式训练报NCCL错

应该是没有装NCCL,但是通过NVIDIA官网方式用apt安装报错,说nccl签名有问题

打开官网查找对应版本的nccl:https://developer.nvidia.com/nccl/nccl-legacy-downloads

这里不下载local Ubuntu选项,下载O/S agnostic local installer这个选项

下载到本地后上传到服务器中,目录自己选

然后解压

复制代码
tar -xvf nccl-xxxx.tar

解压完进入文件夹,把nccl复制过去

复制代码
sudo cp include/* /usr/local/cuda/include
sudo cp lib/* /usr/local/cuda/lib64

然后把路径追加到环境变量中就可以了

复制代码
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:你自己上边解压的路径在哪就写什么
例如:export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/nccl_2.22.3-1+cuda10.0_ppc64le/lib

参考:https://blog.csdn.net/qq_41475067/article/details/123086190?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword\~default-0-123086190-blog-143115894.235^v43^pc_blog_bottom_relevance_base9\&spm=1001.2101.3001.4242.1\&utm_relevant_index=3

相关推荐
国服第二切图仔11 小时前
基于文心开源大模型ERNIE-4.5-0.3B-Paddle私有化部署并构建一个企业智能客服系统
百度·开源·智能客服·知识库·文心大模型·paddle·gitcode
LucianaiB3 天前
百度开源文心4.5系列开源21款模型,实测 ERNIE-4.5-VL-28B-A3B-Paddle 多项评测结果超 Qwen3-235B-A22B
百度·开源·文心大模型·paddle·gitcode
国服第二切图仔4 天前
文心开源大模型ERNIE-4.5-0.3B-Paddle私有化部署保姆级教程及技术架构探索
百度·架构·开源·文心大模型·paddle·gitcode
qq_wuqingdefeng2 个月前
paddle 打包代码 ocr
ocr·paddle
BlackPercy2 个月前
【paddle】常见的数学运算
paddle
米饭咔咔吃2 个月前
飞桨paddle import fluid报错【已解决】
人工智能·paddlepaddle·paddle
米饭咔咔吃2 个月前
飞桨paddle ‘ParallelEnv‘ object has no attribute ‘_device_id‘【已解决】
人工智能·paddlepaddle·paddle
隐形喷火龙2 个月前
paddle ocr本地化部署进行文字识别
ocr·paddle
我变成了柴犬2 个月前
PaddleClas 车辆属性模型vehicle_attribute_model转onnx并部署
paddle
令狐少侠20112 个月前
ai之paddleOCR 识别PDF python312和paddle版本冲突 GLIBCXX_3.4.30
人工智能·pdf·paddle