ubuntu18.04 安装与卸载NCCL conda环境安装PaddlePaddle

cuda版本11.2

说明PaddlePaddle需要安装NCCL

1、Log in | NVIDIA Developer

登录官网

找到对应版本

官方提供了多种安装方式,本文使用Local installers (x86)本地安装

点击对应的版本下载如:

复制代码
nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

安装步骤:

复制代码
sudo dpkg -i nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

# 更新源镜像

sudo apt update

# 安装 nccl

sudo apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

安装nccl的命令来源于:

配置环境变量:

nccl默认的安装目录是/usr/lib/x86_64-linux-gnu,在终端模拟器中使用vim ~/.bashrc 打开配置文件,按插入键 i ,在 ~/.bashrc 文件中添加以下内容之后保存文件:

复制代码
#设置cuda库的目录
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
#将nccl添加到LD_LIBRARY_PATH中
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu

先按Esc退出,再输入:wq,最后执行source ~/.bashrc使文件的配置生效

2、卸载linux系统NCCL安装与卸载_linux_多想常做-Linux

3、安装PaddlePaddleLinux 下的 Conda 安装-使用文档-PaddlePaddle深度学习平台

复制代码
# 创建conda虚拟环境
conda create -n paddle python=3.9

# 激活环境
conda activate paddle

# GPU 版的 PaddlePaddle
# 对于 CUDA 11.2,需要搭配 cuDNN 8.2.1(多卡环境下 NCCL>=2.7),安装命令为:

conda install paddlepaddle-gpu==2.6.1 cudatoolkit=11.2 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge

# 测试安装是否成功

#进入 python 解释器,输入
import paddle
paddle.utils.run_check()

#如果出现PaddlePaddle is installed successfully!,说明您已成功安装。


#安装依赖
#一键安装MOT相关的依赖:

pip install -r requirements.txt
# 或手动pip安装MOT相关的库
pip install lap motmetrics sklearn

安装MOT相关的依赖报错:

note: This error originates from a subprocess, and is likely not a problem with pip.

ERROR: Failed building wheel for lap

Running setup.py clean for lap

Failed to build lap

ERROR: ERROR: Failed to build installable wheels for some pyproject.toml based projects (lap)

将requirements.txt中的lap注释掉,单独安装lap:conda install -c conda-forge lap,

再次运行pip install -r requirements.txt

相关推荐
梦·D·9 分钟前
安全运维工具箱sskit_v1.0.3 部署
运维
CDN36010 分钟前
DNS 负载均衡技术架构与调度策略解析
运维·架构·负载均衡
忡黑梨11 分钟前
eNSP_路由策略
运维·服务器·网络·华为·智能路由器·负载均衡
IT WorryFree23 分钟前
FGT-KVM 完整部署极简教程(CentOS 7 + KVM 环境)
linux·运维·centos
上海云盾安全满满25 分钟前
网站被攻击了,高防CDN相比与高防服务器有什么优点
运维·服务器
一袋米扛几楼9828 分钟前
【报错问题】彻底解决 TypeScript 报错 TS2769: No overload matches this call (JWT 篇)
linux·javascript·typescript
@encryption28 分钟前
计算机网络 --- NAT
运维·服务器·计算机网络
goyeer31 分钟前
【ITIL4】32服务实践 - 服务变更管理
linux·运维·服务器·数字化·价值·itil
程序员Linc32 分钟前
双击nginx.exe5次之后,我的项目管理平台挂了
运维·nginx
扛枪的书生36 分钟前
Git 学习总结
linux