Iridescent:Day33 - 技术栈

DAY 33 MLP 神经网络的训练

知识点回顾：

你今天主要学习了基于PyTorch框架实现多层感知机（MLP）来解决鸢尾花分类问题的完整流程，涵盖了环境配置、数据处理、模型构建和训练的核心环节。

环境配置 ：创建了名为DL的conda环境（Python 3.8），安装了pytorch、scikit-learn等核心依赖；区分了CPU/GPU版本的PyTorch安装，GPU版本需依赖NVIDIA显卡的CUDA/CUDNN组件。
CUDA验证 ：通过nvidia-smi命令查看显卡支持的最高CUDA版本和显存，通过PyTorch代码检查CUDA是否可用、设备数量/名称、实际安装的CUDA版本。

继承nn.Module构建自定义MLP类，包含：
- 输入层（nn.Linear(4, 10)）：4个特征→10个隐藏神经元；
- 激活函数（ReLU）：引入非线性，解决线性模型表达能力不足的问题；
- 输出层（nn.Linear(10, 3)）：10个隐藏神经元→3个分类结果（无激活，因交叉熵损失内置Softmax）；
实现forward方法定义前向传播逻辑（两种写法：显式调用ReLU层/直接用torch.relu）。

损失函数：选用nn.CrossEntropyLoss（适配多分类任务）；
优化器：可选SGD（固定学习率0.01）或Adam（自适应学习率0.001）；
训练循环核心步骤：
1. 前向传播：模型预测训练集输出；
2. 计算损失：预测值与真实标签的误差；
3. 反向传播：optimizer.zero_grad()清零梯度（避免累积）→loss.backward()计算梯度→optimizer.step()更新参数；
4. 记录并打印每100轮的损失值，最后可视化损失曲线。

这些内容覆盖了PyTorch实现简单神经网络的全流程，是后续复杂深度学习项目的基础，重点要理解梯度下降、激活函数、损失函数在训练中的作用。

图1：PyTorch环境配置与CUDA检查流程图。展示从创建conda环境到验证CUDA可用性的完整步骤，包含关键命令和代码片段。

图2：鸢尾花数据集预处理流程图。呈现从数据加载、划分、归一化到张量转换的全过程，标注数据维度变化。

图3：MLP模型架构图。可视化三层神经网络结构，标注各层输入输出维度和激活函数位置。

图4：模型训练循环流程图。展示前向传播、损失计算、反向传播和参数更新的迭代过程，包含关键代码片段。