ubuntu18.04 安装与卸载NCCL conda环境安装PaddlePaddle

cuda版本11.2

说明PaddlePaddle需要安装NCCL

1、Log in | NVIDIA Developer

登录官网

找到对应版本

官方提供了多种安装方式,本文使用Local installers (x86)本地安装

点击对应的版本下载如:

复制代码
nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

安装步骤:

复制代码
sudo dpkg -i nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

# 更新源镜像

sudo apt update

# 安装 nccl

sudo apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

安装nccl的命令来源于:

配置环境变量:

nccl默认的安装目录是/usr/lib/x86_64-linux-gnu,在终端模拟器中使用vim ~/.bashrc 打开配置文件,按插入键 i ,在 ~/.bashrc 文件中添加以下内容之后保存文件:

复制代码
#设置cuda库的目录
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
#将nccl添加到LD_LIBRARY_PATH中
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu

先按Esc退出,再输入:wq,最后执行source ~/.bashrc使文件的配置生效

2、卸载linux系统NCCL安装与卸载_linux_多想常做-Linux

3、安装PaddlePaddleLinux 下的 Conda 安装-使用文档-PaddlePaddle深度学习平台

复制代码
# 创建conda虚拟环境
conda create -n paddle python=3.9

# 激活环境
conda activate paddle

# GPU 版的 PaddlePaddle
# 对于 CUDA 11.2,需要搭配 cuDNN 8.2.1(多卡环境下 NCCL>=2.7),安装命令为:

conda install paddlepaddle-gpu==2.6.1 cudatoolkit=11.2 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge

# 测试安装是否成功

#进入 python 解释器,输入
import paddle
paddle.utils.run_check()

#如果出现PaddlePaddle is installed successfully!,说明您已成功安装。


#安装依赖
#一键安装MOT相关的依赖:

pip install -r requirements.txt
# 或手动pip安装MOT相关的库
pip install lap motmetrics sklearn

安装MOT相关的依赖报错:

note: This error originates from a subprocess, and is likely not a problem with pip.

ERROR: Failed building wheel for lap

Running setup.py clean for lap

Failed to build lap

ERROR: ERROR: Failed to build installable wheels for some pyproject.toml based projects (lap)

将requirements.txt中的lap注释掉,单独安装lap:conda install -c conda-forge lap,

再次运行pip install -r requirements.txt

相关推荐
JuiceFS1 天前
从 MLPerf Storage v2.0 看 AI 训练中的存储性能与扩展能力
运维·后端
CYRUS_STUDIO1 天前
用 Frida 控制 Android 线程:kill 命令、挂起与恢复全解析
android·linux·逆向
熊猫李2 天前
rootfs-根文件系统详解
linux
chen9452 天前
mysql 3节点mgr集群部署
运维·后端
LH_R2 天前
OneTerm开源堡垒机实战(三):功能扩展与效率提升
运维·后端·安全
dessler2 天前
Hadoop HDFS-高可用集群部署
linux·运维·hdfs
泽泽爱旅行2 天前
awk 语法解析-前端学习
linux·前端
少妇的美梦2 天前
logstash教程
运维
chen9452 天前
k8s集群部署vector日志采集器
运维
chen9452 天前
aws ec2部署harbor,使用s3存储
运维