《深度学习》CUDA安装配置、pytorch库、torchvision库、torchaudio库安装

文章目录

一、下载CUDA
- 1、什么是CUDA
- 2、查看电脑支持版本号
3、下载CUDA包
- 1）进入下列下载位置
- 2）选择版本
4、安装CUDA
- 1）双击下载好的文件，然后得到下列图像
- 2）选择自定义安装
- [3）取消选项Visual Integration](#3）取消选项Visual Integration)
- 4）使用默认安装位置
- 5）安装完成**
- 6）配置环境变量
- 3、查看环境变量
- 7）测试是否成功安装
二、下载pytorch包

一、下载CUDA

1、什么是CUDA

CUDA（Compute Unified Device Architecture，统一计算设备架构）是 NVIDIA 推出的并行计算平台与编程模型，允许开发者使用 C/C++（以及 Python、Fortran 等语言绑定）在 NVIDIA GPU 上进行通用计算（GPGPU, General-Purpose computing on Graphics Processing Units）。

它的核心价值在于：将 GPU 从单纯的图形渲染加速器，转变为可执行大规模并行计算的通用处理器，从而显著提升科学计算、AI 推理与训练、图像处理等领域的运算效率。

2、查看电脑支持版本号

打开命令提示符，输入命令nvidia-smi,即可查看电脑支持的最高版本的版本号

如下图所示：

3、下载CUDA包

1）进入下列下载位置

CUDA官网
<icon-default.png?t=O83Ahttps://developer.nvidia.com/cuda-toolkit-archive>

2）选择版本

得到下列画面，此时其内有各个版本的CUDA，选择尽量低于电脑版本的，防止有过高的版本不稳定的情况。

选择好版本，点开，选择系统和版本

4、安装CUDA

1）双击下载好的文件，然后得到下列图像

2）选择自定义安装

3）取消选项Visual Integration

若计算机已安装与当前CUDA版本兼容的Visual Studio Integration文件，或通过单独安装Visual Studio插件等方式完成了CUDA支持的集成，此时在安装CUDA过程中勾选"Visual Studio Integration"选项，可能因冲突或重复安装引发问题。

4）使用默认安装位置

安装位置不要动，使用默认的即可，防止出现问题

5）安装完成**

6）配置环境变量

1、直接在搜索栏搜索环境变量

3、查看环境变量

查看是否有这个环境变量，如果没有则需手动增加，增加内容即为图示内容，点击新建即可

或者在命令提示符内输入命令set cuda查看环境变量

7）测试是否成功安装

在命令提示符内输入命令nvcc --version 或者nvcc -V，查看是否有cuda，如果有则安装成功，如果没有则可能版本不兼容

二、下载pytorch包

1、什么是torch

PyTorch（常简称torch）是由Meta主导开发的开源深度学习框架，以Python为基础，核心特点是动态计算图------运行时实时构建计算逻辑，支持灵活调试和动态控制流，适配研究场景的快速迭代；同时以张量（Tensor）为核心数据结构，原生支持GPU加速，并通过autograd机制自动完成梯度计算，大幅简化模型训练流程。

它提供模块化API（如nn.Module）快速搭建网络，生态覆盖预训练模型（torchvision/torchtext）、分布式训练和部署工具（TorchScript/LibTorch），既能满足学术研究的灵活性需求，也能支撑工业级模型开发与落地，是CV、NLP等领域的主流框架之一。

2、下载torch

进入pytorch官网，选择好需要的类别，然后将下列链接复制到浏览器打开，选择版本进行下载，因为torch所占内存太大，直接用其所给命令去命令提示符下载如果网络稍微有波动则会导致下载失败，所以直接去源网页下载，下列是官网入口：

复制代码

    pytorch官网

<icon-default.png?t=O83Ahttps://pytorch.org/>

1）复制上述链接打开，然后下拉找到torch，点开

2）找到需要的版本

可以使用网页查找命令，长按ctrl+F，然后输入需要的版本，cu表示安装的cuda版本，cp表示python版本，例如下图所示，我下载的是torch1.13.0，cuda版本可以比安装的版本低，但是不能比安装的版本高，python版本为3.10，python版本可以在命令提示符内输入命令python或者where python查看，如下图所示

3）安装库

上述的链接既是下载链接，建议放入迅雷下载器下载，这个下载更快，其他的也行，怎么快怎么来。下载完是如下的文件格式，然后打开命令提示符，使用命令pip install 文件地址，即可安装。如下图所示

或者直接右击复制地址：

4）检查是否安装成功

命令提示符输入命令pip list即可查看

3、torchaudio库是什么

torchaudio是PyTorch官方推出的音频领域专用库，与torchvision（图像）、torchtext（文本）同属PyTorch生态，核心定位是为音频数据的处理、特征提取及深度学习任务提供与PyTorch无缝衔接的工具链。

它以PyTorch的张量（Tensor）为基础数据结构，确保音频数据可直接参与GPU加速运算，避免格式转换开销；内置常见音频预处理功能（如加载/保存不同格式音频、重采样、分帧、加窗）、经典声学特征提取（如梅尔频谱、MFCC、频谱图），以及针对音频任务的预训练模型（如语音识别、声音分类）。同时，它与PyTorch的训练流程深度兼容------从数据加载、特征变换到模型输入输出均保持张量格式，能无缝嵌入PyTorch的DataLoader、nn.Module等组件，大幅简化音频深度学习任务的开发（如语音识别、音乐分类、环境音检测等）。

4、下载torchaudio库

重复上述安装torch的步骤即可，选好版本号

5、torchvision库是什么

torchvision是PyTorch官方推出的计算机视觉（CV）领域专用库，与torchaudio（音频）、torchtext（文本）共同构成PyTorch生态的核心垂直工具集，专为图像/视频类任务提供与PyTorch无缝衔接的全流程支持。

它以PyTorch张量为核心数据结构，确保图像数据可直接参与GPU加速运算；内置三大关键能力：一是数据集加载（如ImageNet、COCO、MNIST等经典CV数据集的一键获取与预处理），二是图像预处理与增强（如裁剪、翻转、归一化、随机噪声等常用操作，支持构建灵活的数据变换 pipeline），三是预训练模型库（涵盖ResNet、VGG、ViT等经典网络架构，可直接加载权重用于迁移学习或推理）。此外，它还提供目标检测、图像分割等任务的工具函数（如边界框处理、评价指标计算），能无缝嵌入PyTorch的DataLoader、nn.Module等训练流程，大幅降低图像分类、目标检测、语义分割等CV任务的开发门槛。

6、下载torchvision

步骤和上述一致，注意版本号。