深度学习（深度神经网络）Pytorch框架

一.深度学习核心框架的选择

1.深度学习框架的介绍

2.框架选择与安装

3.CPU与GPU的架构差异

4.GPU的显存与性能指标

5.pytorch安装（GPU版本）

①查看GPU

②在命令行输入nvidia-smi查看cuda版本

③安装cuda驱动软件

[④输入nvcc --V查看cuda是否安装成功](#④输入nvcc –V查看cuda是否安装成功)

⑤安装torch（自行下载安装包，离线导入三方库的方式）

一.深度学习核心框架的选择

1.深度学习框架的介绍

Caffe（2015年）：贾扬清开发，早期主流框架，因缺乏持续更新逐渐被淘汰。
TensorFlow（2017年） ：
- 一版本代码冗长，后被Keras封装简化。
- 二版本优化底层但不兼容一版本，目前仍广泛使用。
PyTorch（2018年） ：
- Facebook开发，易用性高，支持动态计算图。
- 近年使用率显著上升（约59%），成为大模型开发的主流框架。

2.框架选择与安装

推荐优先学习PyTorch，因其社区支持、易用性及大模型适配性。
安装指南：
- 访问官网（pytorch.org），选择稳定版（如2.8.0）、操作系统（Windows）、包管理工具（pip）及计算平台（CPU/GPU）。
GPU优势：
- 并行计算能力强，适合处理矩阵运算（如图像数据），显著加速模型训练。
- 对比CPU需切割数据分批处理，GPU可直接处理大规模矩阵。

3.CPU与GPU的架构差异

GPU设计：90%运算单元，5%控制单元，5%缓存单元，专注于并行计算（如画面渲染）。
CPU设计：强调多任务/多线程处理，需强大控制单元（处理if/while等逻辑）。
英伟达早期显卡主要用于游戏，2019年后因AI需求爆发（如深度学习）成为核心硬件。

4.GPU的显存与性能指标

显存容量：决定算力空间（如6G、24G），直接影响同时处理的数据量（如多张图片并行计算）。
显存频率（如1600-5000兆赫兹）：越高则数据处理速度越快。
显存位宽（如64-384位）：单周期内传输数据量，影响执行效率。
推荐优先关注显存容量，其次为频率和位宽。

5.pytorch安装（GPU版本）

①查看GPU

打开任务管理器，点开性能一栏

②在命令行输入nvidia-smi查看cuda版本

CUDA作用：作为GPU计算的桥梁，提供编程接口，使程序能调用GPU算力

注意：：显示的CUDA版本为驱动支持的最高版本，需单独安装CUDA工具包

版本选择：根据查询结果选择匹配的PyTorch版本（如驱动支持12.7则选≤12.7的CUDA版本）

③安装cuda驱动软件

自行搜索安装教程

④输入nvcc --V查看cuda是否安装成功

⑤安装torch（自行下载安装包，离线导入三方库的方式）

进入官网https://download.pytorch.org/whl

找到torch并进入

下载完成之后打开文件所在地址复制，在命令行使用pip install 地址进行离线安装torch库

相同的操作下载torchvision和torchaudio库离线安装，注意版本号的选择 版本需与 CUDA 版本一致（如 torch 1.17 对应 torchvision 0.14.1、torchaudio 0.13.1

二.pytorch框架的认识

1.构架神经网络模型

python 复制代码

import torch
from torch import nn#导入神经网络模块
from torch.utils.data import DataLoader#数据包管理工具，打包数据
from torchvision import datasets#封装了很多与图像相关的模型，和数据集
from torchvision.transforms import ToTensor#将其他数据类型转化为张量

①数据集与工具介绍

torchvision.datasets 提供预置数据集（如 MNIST 手写数字），可直接下载并自动转换为 tensor 类型（张量数据）。
torch.utils.data.DataLoader 用于管理数据集，transforms 模块用于数据预处理（如转为张量）。

示例：通过 MNIST(root='data', train=True, download=True, transform=ToTensor()) 下载训练集，标签为数字（0-9）。

python 复制代码

train_data=datasets.MNIST(
    root='data',
    train=True,
    download=True,
    transform=ToTensor()
)
test_data=datasets.MNIST(
    root='data',
    train=False,
    download=True,
    transform=ToTensor()
)

train=True,是否读取下载后数据中的训练集

download=True,如果之前下载过则不用下载

②数据可视化

使用 matplotlib 展示图片：从 train_data 提取单张图片（如第 59000 张），通过 squeeze() 降维（从三维 [1,28,28] 到二维 [28,28]），以灰度图形式显示。
代码示例：循环展示 9 张图片，关闭坐标轴（axis('off')），标签标注对应数字。

python 复制代码

#展示手写照片
from matplotlib import pyplot as plt
figure=plt.figure()
for i in range(9):
    img,label=train_data[i+59000]
    figure.add_subplot(3,3,i+1)
    plt.title(label)
    plt.axis('off')
    plt.imshow(img.squeeze(),cmap='gray')
plt.show()

img,label=train_data[i+59000]#提取第59000张照片

figure.add_subplot(3,3,i+1)#图像窗口中创建多个小窗口，小窗口用于显示图片plt.imshow(img.squeeze(),cmap='gray')#img.squeeze()从张量img中去掉维度为1的，如果该维度大小不为1则不会改变，cmap='gray'表示显示灰度图