PyTorch 实战：CIFAR-10 图像分类与网络优化

图像分类是计算机视觉领域的基础任务，CIFAR-10 数据集包含 10 类常见物体的图像，是入门图像分类的经典数据集。本文将使用 PyTorch 框架，从数据加载与预处理开始，构建卷积神经网络（CNN）进行 CIFAR-10 图像分类，并对网络进行优化，提升分类性能。

CIFAR-10 数据集有 60000 张 32×32 彩色图像，分为 10 类，每类 6000 张。其中 50000 张用于训练，10000 张用于测试。

首先导入必要的库，然后定义数据转换操作，将图像转换为张量并进行标准化，接着加载训练集和测试集，并使用 DataLoader 来批量加载数据。

为了直观查看数据，我们还可以定义一个函数来显示图像：

我们构建一个包含两层卷积、两层池化和两层全连接的 CNN 模型。卷积层用于提取图像特征，池化层用于降低特征维度，全连接层用于分类。

使用随机梯度下降（SGD）优化器和交叉熵损失函数来训练模型，训练 10 个 epoch。

在测试集上评估模型的性能，包括总体准确率和各类别的准确率。

为了减少模型参数数量，同时保证一定的性能，我们引入全局平均池化（GAP）层。全局平均池化可以替代全连接层，减少参数数量，还能增强模型的泛化能力。

同样使用 SGD 优化器和交叉熵损失函数训练优化后的模型，然后在测试集上评估性能，对比优化前后的效果。

本文从 CIFAR-10 数据集的加载与预处理开始，构建了基础的 CNN 模型进行图像分类，然后通过引入全局平均池化层对网络进行优化，减少了模型参数数量。