ubuntu18.04 安装与卸载NCCL conda环境安装PaddlePaddle

cuda版本11.2

说明PaddlePaddle需要安装NCCL

1、Log in | NVIDIA Developer

登录官网

找到对应版本

官方提供了多种安装方式,本文使用Local installers (x86)本地安装

点击对应的版本下载如:

复制代码
nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

安装步骤:

复制代码
sudo dpkg -i nccl-local-repo-ubuntu1804-2.8.4-cuda11.2_1.0-1_amd64.deb

# 更新源镜像

sudo apt update

# 安装 nccl

sudo apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

安装nccl的命令来源于:

配置环境变量:

nccl默认的安装目录是/usr/lib/x86_64-linux-gnu,在终端模拟器中使用vim ~/.bashrc 打开配置文件,按插入键 i ,在 ~/.bashrc 文件中添加以下内容之后保存文件:

复制代码
#设置cuda库的目录
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
#将nccl添加到LD_LIBRARY_PATH中
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/x86_64-linux-gnu

先按Esc退出,再输入:wq,最后执行source ~/.bashrc使文件的配置生效

2、卸载linux系统NCCL安装与卸载_linux_多想常做-Linux

3、安装PaddlePaddleLinux 下的 Conda 安装-使用文档-PaddlePaddle深度学习平台

复制代码
# 创建conda虚拟环境
conda create -n paddle python=3.9

# 激活环境
conda activate paddle

# GPU 版的 PaddlePaddle
# 对于 CUDA 11.2,需要搭配 cuDNN 8.2.1(多卡环境下 NCCL>=2.7),安装命令为:

conda install paddlepaddle-gpu==2.6.1 cudatoolkit=11.2 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge

# 测试安装是否成功

#进入 python 解释器,输入
import paddle
paddle.utils.run_check()

#如果出现PaddlePaddle is installed successfully!,说明您已成功安装。


#安装依赖
#一键安装MOT相关的依赖:

pip install -r requirements.txt
# 或手动pip安装MOT相关的库
pip install lap motmetrics sklearn

安装MOT相关的依赖报错:

note: This error originates from a subprocess, and is likely not a problem with pip.

ERROR: Failed building wheel for lap

Running setup.py clean for lap

Failed to build lap

ERROR: ERROR: Failed to build installable wheels for some pyproject.toml based projects (lap)

将requirements.txt中的lap注释掉,单独安装lap:conda install -c conda-forge lap,

再次运行pip install -r requirements.txt

相关推荐
Elecard 中国10 小时前
大规模媒体库如何实现自动化 QC?聊聊 VoD 文件检测架构
运维·自动化·ott·视频质检·vod·#视频编码·#音视频技术
Jurio.10 小时前
Codex cli 分屏并行运行
linux·ai·远程工作·codex
DolphinScheduler社区10 小时前
DolphinScheduler 3.1.3 跨越升级 3.4.1:基于 API 的自动化迁移方案
大数据·运维·自动化·任务调度·海豚调度
dangdanding11 小时前
防火墙 IP 分片测试套件-fragroute
linux·网络·网络协议·tcp/ip
happymade11 小时前
全网拓扑自动发现与服务器全维度监控的技术实践
linux·运维·服务器·网络·zabbix·路由器·prometheus
小小菜鸟,可笑可笑11 小时前
Ubuntu 系统安装搜狗输入法 & 使用英文标点
ubuntu
Ysn071911 小时前
中文乱码:在 Docker 容器中设置中文语言环境
运维·python·docker·容器
米高梅狮子11 小时前
01.CentOS-Stream-8-packstack安装OpenStack
linux·云原生·容器·kubernetes·centos·自动化·openstack
xiaoye-duck11 小时前
《Linux系统编程》Linux基础开发工具 (二):详解自动化构建 make / Makefile
linux
OpsEye11 小时前
数据库连接池爆了,这3个命令能救你一次
运维·数据库·后端