ubuntu18.04 安装与卸载NCCL conda环境安装PaddlePaddle

cuda版本11.2

说明PaddlePaddle需要安装NCCL

1、Log in | NVIDIA Developer

登录官网

找到对应版本

官方提供了多种安装方式,本文使用Local installers (x86)本地安装

点击对应的版本下载如:

复制代码
nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

安装步骤:

复制代码
sudo dpkg -i nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

# 更新源镜像

sudo apt update

# 安装 nccl

sudo apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

安装nccl的命令来源于:

配置环境变量:

nccl默认的安装目录是/usr/lib/x86_64-linux-gnu,在终端模拟器中使用vim ~/.bashrc 打开配置文件,按插入键 i ,在 ~/.bashrc 文件中添加以下内容之后保存文件:

复制代码
#设置cuda库的目录
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
#将nccl添加到LD_LIBRARY_PATH中
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu

先按Esc退出,再输入:wq,最后执行source ~/.bashrc使文件的配置生效

2、卸载linux系统NCCL安装与卸载_linux_多想常做-Linux

3、安装PaddlePaddleLinux 下的 Conda 安装-使用文档-PaddlePaddle深度学习平台

复制代码
# 创建conda虚拟环境
conda create -n paddle python=3.9

# 激活环境
conda activate paddle

# GPU 版的 PaddlePaddle
# 对于 CUDA 11.2,需要搭配 cuDNN 8.2.1(多卡环境下 NCCL>=2.7),安装命令为:

conda install paddlepaddle-gpu==2.6.1 cudatoolkit=11.2 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge

# 测试安装是否成功

#进入 python 解释器,输入
import paddle
paddle.utils.run_check()

#如果出现PaddlePaddle is installed successfully!,说明您已成功安装。


#安装依赖
#一键安装MOT相关的依赖:

pip install -r requirements.txt
# 或手动pip安装MOT相关的库
pip install lap motmetrics sklearn

安装MOT相关的依赖报错:

note: This error originates from a subprocess, and is likely not a problem with pip.

ERROR: Failed building wheel for lap

Running setup.py clean for lap

Failed to build lap

ERROR: ERROR: Failed to build installable wheels for some pyproject.toml based projects (lap)

将requirements.txt中的lap注释掉,单独安装lap:conda install -c conda-forge lap,

再次运行pip install -r requirements.txt

相关推荐
yuhaiqun19898 小时前
学服务器训练AI模型:5步路径助力高效入门
运维·服务器·人工智能·笔记·机器学习·ai
huaweichenai8 小时前
docker部署kkFileView实现文件预览功能
运维·docker·容器
以太浮标8 小时前
华为eNSP模拟器综合实验之-BFD联动配置解析
运维·网络·华为·信息与通信
工程师老罗9 小时前
龙芯2k0300 PMON取消Linux自启动
linux·运维·服务器
千百元9 小时前
centos如何删除恶心定时任务
linux·运维·centos
skywalk81639 小时前
网站证书自动续订失败的问题解决,原来是续订指令certbot renew出错,导致crontab定时任务续订失败
运维·服务器·证书·certbot
额呃呃9 小时前
游戏服务器和一般高性能服务器的区别
运维·服务器·游戏
2501_9061505610 小时前
开源问卷平台DWSurvey开发配置记录
运维·开源·jenkins
gaize121310 小时前
服务器分类及区别划分!多样化服务器用途体系架构及层次分类
运维·服务器·架构
鲁正杰10 小时前
【运维部署】现代化内网穿透与文件共享方案 (Rust)
运维·开发语言·rust