CUDA cuDNN和pytorch(GPU版)的完整安装教程

* 说明: 本教程使用wsl-ubuntu20.04, 其他发行版linux的命令可能有所区别.

*实测机型: i5-13500HX | RTX 4060 Laptop

一、下载CUDA12.X版本

这里以下载CUDA12.2为例。

  1. 前往cuda-12.2下载页, 按照如图方式选择合适的选项:
  2. 按照官方给出的命令, 在bash中依此执行:
bash 复制代码
​wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda
  1. 添加环境变量
    使用vim等打开~/.bashrc,在末尾添加:
bash 复制代码
export PATH=/usr/local/cuda-12.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64:$LD_LIBRARY_PATH
  1. 验证安装是否成功
bash 复制代码
source ~/.bashrc
nvcc -V  # 查看CUDA版本
二、下载cuDNN
  1. 前往cuDNN Archive 下载合适的cudnn版本。由于我们下载的是CUDA12.X版本,这里我们就选择下载8.9.7版本的cudnn.

    点击后浏览器会接管下载, 可以通过如图方式复制下载链接.

  2. 安装cudnn软件包

我们在终端中输入以下命令:

bash 复制代码
wget -O cudnn.deb <你的下载链接>  # 下载的文件会命名为cudnn.deb
dpkg -i cudnn.deb  # 安装前置软件包
sudo apt update # 更新并获取cudnn的下载源
sudo apt-get install libcudnn8 # 正式安装cudnn软件包
sudo apt-get install libcudnn8-dev # 安装cudnn开发库(可选)

完成上述工作后,可通过下述命令检测是否安装成功:

bash 复制代码
ls /usr/lib/x86_64-linux-gnu/libcudnn*
ls /usr/include/cudnn.h
dpkg -l | grep -i cudnn
三、安装GPU版的pytorch

Pytorch下载地址

Pytorch包含三个库:torch,torchvision和torchaudio;根据社区的说明,torch-cu118版本能够兼容CUDA12.X,可通过该命令进行安装:

bash 复制代码
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

* 官方更新后通过pip默认下载的就是支持CUDA12.1的pytorch, 命令如下:

bash 复制代码
pip3 install torch torchvision torchaudio

注: 本教程安装的是cu118版本, 读者可尝试第二种方法进行安装。

四、验证pytorch的CUDA可用性
  1. 先确定pytorch有没有装错,可以在终端输入pip list,查看torch版本,cu后缀就表示支持GPU。
  2. 在python中执行torch.cuda.is_available() 返回True说明使用的就是GPU版本。
五、体验Pytorch GPU和CPU运算的速度差距
python3 复制代码
import torch
from time import perf_counter

def cpu_process():
    x = torch.rand(1000,10000)
    y = torch.rand(10000,10000)
    start = perf_counter()
    x.mm(y)
    end = perf_counter()
    print('CPU process time:',end-start)
    
def gpu_process():
    x = torch.rand(1000,10000).cuda()
    y = torch.rand(10000,10000).cuda()
    start = perf_counter()
    x.mm(y)
    end = perf_counter()
    print('GPU process time:',end-start)

if __name__ == '__main__':
    cpu_process()  # CPU process time: 0.5139300849996289
    gpu_process()  # GPU process time: 0.02356865599995217

可以明显看到GPU运算速度相比CPU快了20倍左右 !

相关推荐
shangjian007几秒前
AI-大语言模型LLM-概念术语-Dropout
人工智能·语言模型·自然语言处理
小鸡吃米…几秒前
机器学习 - 高斯判别分析(Gaussian Discriminant Analysis)
人工智能·深度学习·机器学习
香芋Yu1 分钟前
【机器学习教程】第01章:机器学习概览
人工智能·机器学习
HAPPY酷1 分钟前
构建即自由:一份为创造者设计的 Windows C++ 自动化构建指南
开发语言·c++·ide·windows·python·策略模式·visual studio
瑶池酒剑仙2 分钟前
Libvio.link爬虫技术解析大纲
爬虫·python
HySpark7 分钟前
关于语音智能技术实践与应用探索
人工智能·语音识别
H Journey7 分钟前
Linux su 命令核心用法总结
java·linux·服务器·su
AI应用开发实战派8 分钟前
AI人工智能中Bard的智能电子商务优化
人工智能·ai·bard
喵手9 分钟前
Python爬虫实战:构建 Steam 游戏数据库:requests+lxml 实战游戏列表采集与价格监控(附JSON导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集steam商店游戏列表数据·sqlite数据库存放采集数据·价格监控游戏推荐市场分析
FL162386312914 分钟前
MMA综合格斗动作检测数据集VOC+YOLO格式1780张16类别
人工智能·yolo·机器学习