前言:此篇文章以Pytorch2.0.0+CUDA11.8+cuDNN8.9.2为例
1、为什么要在虚拟环境中安装cuda、cudann?
(1) 隔离依赖
虚拟环境可以帮助隔离不同项目所需的依赖库和版本,避免冲突。例如,不同项目可能需要不同版本的 CUDA 或 cuDNN 来支持特定的深度学习框架(如 TensorFlow、PyTorch)的版本要求。将这些库安装在虚拟环境中,确保每个项目使用其特定的版本,避免系统环境中的全局冲突。
(2)方便管理和维护
在虚拟环境中安装 CUDA 和 cuDNN 可以简化管理和更新流程。例如,针对某个项目进行版本升级或降级时,可以在虚拟环境内更改依赖而不会影响到其他项目的运行。
(3)提升兼容性
在深度学习开发中,不同的深度学习框架(如 TensorFlow 和 PyTorch)可能对 CUDA、cuDNN 的版本有不同的要求。在虚拟环境中安装专用版本,能够确保不同项目在不同的依赖版本下正确运行,避免在系统范围内安装多个版本而导致冲突。
(4)方便迁移和部署
使用虚拟环境将 CUDA、cuDNN 和项目代码、库等绑定在一起,便于在不同的机器上进行迁移或部署。这样可以确保在另一台机器上运行时,环境一致,减少因环境差异带来的问题。
(5)快速重置环境
在开发和测试中,可能需要快速重置或重建环境。将 CUDA 和 cuDNN 安装在虚拟环境中,可以更方便地删除或重建,而不会影响到全局的系统配置。
2、虚拟环境
(1)创建conda虚拟环境
conda create -n name python=3.x
python
conda create -n chatGLM python=3.9
(2)激活conda虚拟环境
conda activate name
python
conda activate chatGLM
ps:后面的操作均在激活的虚拟环境执行
(3)查看CUDA版本
系统的 CUDA 驱动版本决定了支持的最高 CUDA Toolkit 版本,并且该驱动对低版本的 CUDA Toolkit 具有向下兼容性。
python
nvidia-smi
比如我的CUDA Version=12.7,那么它就可以支持 ≤ 12.7版本的CUDATookit
(4)安装cudatoolkit和cudnn包
查看支持的cuda版本
python
conda search cudatoolkit
或者
conda search cudatoolkit --info
进入pytorch官网:网址
复制
python
conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 pytorch-cuda=11.8 -c pytorch -c nvidia
出现done完成!如果出现以下情况,再试一次;
安装特定版本的cuda:
python
conda install cuda -c nvidia/label/cuda-11.8.0
conda install cuda-cudart-dev -c nvidia
或者
conda install nvidia/label/cuda-11.8.0::cuda --channel nvidia/label/cuda-11.8.0
如果出现:
python
conda install -c nvidia cuda-nvcc=11.8.89 --clobber
安装指定版本的cudnn:
python
conda install cudnn=8.9.2
pip list查看是否安装完成
验证是否安装成功:
python
python
import torch
torch.cuda.is_available()
出现true即为环境搭建成功!