Day37 MLP神经网络的训练

先搞懂基础准备:PyTorch + CUDA(让训练更快)

MLP 训练通常用PyTorch 框架 ,如果电脑有 N 卡(NVIDIA 显卡),可以装CUDA让显卡帮着加速计算。

  • 安装:先装对应版本的 CUDA,再装 PyTorch(官网会给匹配的安装命令)。
  • 检查 CUDA:装完后在 Python 里输入import torch; print(torch.cuda.is_available()),输出True就是能用显卡了。
  • 查显卡信息:Windows 的 CMD 里输入nvidia-smi,就能看到显卡型号、CUDA 版本这些。

MLP 训练的核心流程(对应笔记里的 "简单神经网络流程")

假设我们要训练一个 MLP 做 "分类 / 回归" 任务,步骤是这样的:

1. 数据预处理

得把数据变成模型能认的格式:

  • 归一化:比如把数据缩到 0~1 之间(避免数值太大干扰训练);
  • 转张量:用 PyTorch 的torch.tensor()把数据(比如 Excel 里的表格)转成 "张量"(相当于 PyTorch 里的数组)。
2. 定义 MLP 模型

MLP 是 "多层感知机",就是一堆 "全连接层" 堆起来。在 PyTorch 里这么写:

  • 继承nn.Module:所有模型都得是这个类的 "子类";
  • 定义层:比如self.layer1 = nn.Linear(输入特征数, 隐藏层神经元数)(全连接层);
  • 前向传播:定义数据怎么从输入层→隐藏层→输出层,比如x = torch.relu(self.layer1(x))(relu 是激活函数,让模型能学非线性关系)。
3. 选 "损失函数" 和 "优化器"
  • 损失函数:衡量 "模型预测值" 和 "真实值" 的差距(比如分类用CrossEntropyLoss,回归用MSELoss);
  • 优化器:负责 "调整模型参数" 来减小损失(常用Adam,直接调参数就行)。
4. 训练流程(核心!)

就是 "喂数据→算损失→调参数" 循环:

  1. 把数据喂给模型,得到预测结果;
  2. 用损失函数算 "预测值" 和 "真实值" 的损失;
  3. 优化器 "反向传播":从损失往回算每个参数的 "梯度"(相当于 "参数怎么改能减小损失");
  4. 优化器更新参数:根据梯度调整模型里的权重、偏置这些参数;
  5. 重复上面步骤,直到损失足够小。
5. 可视化 loss 过程

训练时记录每一轮的损失,用 Matplotlib 画个折线图,能直观看到 "损失是不是越来越小"(如果损失不下降,说明训练有问题)。

举个极简的例子(比如用 MLP 做数字识别):

复制代码
import torch
import torch.nn as nn
import torch.optim as optim

# 1. 假数据(比如10个样本,每个样本有5个特征,标签是0/1)
data = torch.randn(10, 5)  # 10个样本,每个5个特征
labels = torch.randint(0, 2, (10,))  # 10个标签(0或1)

# 2. 定义MLP模型
class MLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.layer1 = nn.Linear(5, 10)  # 输入5特征→隐藏层10神经元
        self.layer2 = nn.Linear(10, 2)   # 隐藏层10→输出2类(对应0/1)
    def forward(self, x):
        x = torch.relu(self.layer1(x))  # 隐藏层加激活
        return self.layer2(x)

model = MLP()

# 3. 损失函数+优化器
loss_fn = nn.CrossEntropyLoss()  # 分类任务用的损失
optimizer = optim.Adam(model.parameters(), lr=0.001)  # Adam优化器

# 4. 训练(比如训5轮)
loss_history = []  # 记录损失
for epoch in range(5):
    # 喂数据算预测
    pred = model(data)
    # 算损失
    loss = loss_fn(pred, labels)
    # 反向传播+更新参数
    optimizer.zero_grad()  # 清空之前的梯度
    loss.backward()        # 算梯度
    optimizer.step()       # 更新参数
    # 记录损失
    loss_history.append(loss.item())
    print(f"第{epoch+1}轮,损失:{loss.item():.4f}")

# 5. 画损失曲线
import matplotlib.pyplot as plt
plt.plot(loss_history)
plt.xlabel("轮数")
plt.ylabel("损失")
plt.show()

@浙大疏锦行

相关推荐
风栖柳白杨2 分钟前
【语音识别】soundfile使用方法
人工智能·语音识别
胡西风_foxww3 分钟前
ObsidianAI_学习一个陌生知识领域_建立学习路径和知识库框架_写一本书
人工智能·笔记·学习·知识库·obsidian·notebooklm·写一本书
Hernon3 分钟前
AI智能体 - 探索与发现 Clawdbot >> Moltbot
大数据·人工智能·ai智能体·ai开发框架
输出的都是我的3 分钟前
科研-工具箱汇总
人工智能
昨夜见军贴061620 分钟前
IACheck AI审核功能进化新维度:重构检测报告审核技术价值链的系统路径
人工智能·重构
好奇龙猫33 分钟前
【人工智能学习-AI入试相关题目练习-第十二次】
人工智能·学习
tzc_fly1 小时前
IEEE TPAMI 2026 | ConsistID:多模态高保真肖像生成
人工智能
7***n751 小时前
2026年GEO深度评测:AI时代营销新基建的实践者与分化
大数据·人工智能
愚公搬代码1 小时前
【愚公系列】《AI+直播营销》052-入局 Al 虚拟数字人直播(适合Al虚拟数字人直播的3种直播类型)
人工智能
爱吃泡芙的小白白1 小时前
神经网络压缩实战指南:让大模型“瘦身”跑得更快
人工智能·深度学习·神经网络·模型压缩