深度学习o - 技术栈

深度学习o

咩?2025-09-27 20:20

展平了模型的复杂结构，重点介绍了一个包含输入、一个展平层、三个全连接层以及softmax输出层的经典网络架构。

明确了各全连接层神经元数量的设计原则：早期的特征提取层（如第一个全连接层）神经元数量较多，以捕捉复杂的特征；后续的分类层则逐步减少至最终输出的类别数（此处为10），并通过对输出的置信度进行求和来确定最终结果。

残差模块（ResNet）是将原始输入与经过卷积操作后的结果一同送入后继层次，以解决深层网络中的梯度消失问题。

PyTorch框架的代码实现流程:包含了网络类的定义、前向传播（正向传播）和反向传播机制

提到了使用GPU进行加速时，需要安装CUDA和cuDNN，这会显著提升模型训练和推理的速度

讨论了网络信息从输入到输出的正向传播路径

正向传播的具体步骤包括：经过卷积层、激活层、池化层，再到全连接层进行处理

在计算完损失函数后，还需进行一次完整的正向传播，以获取模型的最终输出

如何从多维的结果中提取单个预测值：在指定的维度（轴一方向）上取最大值。