Pytorch学习笔记(模型训练)

模型训练

在同一个包下创建train.pymodel.py,按照步骤先从数据处理,模型架构搭建,训练测试,统计损失,如下面代码所示

  1. train.py
py 复制代码
import torch.optim
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

from model import NNN

# 1. 准备数据集
train_data = torchvision.datasets.CIFAR10("./data", train=True, transform=torchvision.transforms.ToTensor(),
                                          download=True)
test_data = torchvision.datasets.CIFAR10("./data", train=False, transform=torchvision.transforms.ToTensor(),
                                         download=True)

train_data_size = len(train_data)
test_data_size = len(test_data)
print(f"训练数据集的长度:{train_data_size}")
print(f"测试数据集的长度:{test_data_size}")

# 2. 利用DataLoader 加载数据集
train_dataloader = DataLoader(train_data, batch_size=64)
test_dataloader = DataLoader(test_data, batch_size=64)

# 3. 搭建神经网络
# 引入model.py
nnn = NNN()

# 4. 创建损失函数loss
loss_fn = nn.CrossEntropyLoss()  # 交叉熵

# 5. 优化器
learning_rate = 0.01
optimizer = torch.optim.SGD(nnn.parameters(), lr=learning_rate)  # 随机梯度下降

# 6. 设置训练网络的一些参数
total_train_step = 0  # 记录训练次数
total_test_step = 0  # 训练测试次数
epoch = 10  # 训练轮数

# 补充tensorboard
writer = SummaryWriter("../logs")

# 开始训练
for i in range(epoch):
    print(f"--------第{i+1}轮训练开始--------")
    # 训练
    nnn.train()
    for data in train_dataloader:
        imgs, targets = data
        outputs = nnn(imgs)
        loss = loss_fn(outputs, targets)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step += 1
        if total_train_step % 100 == 0:
            print(f"训练次数:{total_train_step}---loss:{loss.item()}")
            writer.add_scalar("train_loss", loss.item(), total_train_step)

    # 测试
    nnn.eval()
    total_test_loss = 0  # 总体的误差
    total_accuracy = 0  # 总体的正确率
    with torch.no_grad():
        for data in test_dataloader:
            imgs, targets = data
            outputs = nnn(imgs)
            loss = loss_fn(outputs, targets)
            total_test_loss += loss.item()
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy += accuracy
    print(f"整体测试集上的loss:{total_test_loss}")
    print(f"整体测试集上的准确率:{total_accuracy/test_data_size}")
    writer.add_scalar("test_loss", total_test_loss, total_test_step)
    writer.add_scalar("total_accuracy", total_accuracy/test_data_size, total_test_step)
    total_test_step += 1

    # 保存每一轮训练的模型
    torch.save(nnn, f"nnn_{i+1}.pth")
    print("模式已保存")


writer.close()
  1. model.py
py 复制代码
import torch
from torch import nn


# 搭建神经网络
class NNN(nn.Module):
    def __init__(self):
        super(NNN, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 32, 5, stride=1, padding=2),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(32, 32, 5, stride=1, padding=2),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(32, 64, 5, stride=1, padding=2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(1024, 64),
            nn.Linear(64, 10)
        )

    def forward(self, x):
        x = self.model(x)
        return x


if __name__ == '__main__':
    nnn = NNN()
    input = torch.ones((64, 3, 32, 32))
    output = nnn(input)
    print(output.shape)

运行train.py后可以通过启动tensorboard进行查看我们的loss情况,损失是不断下降的。


补充argmax函数的使用

我们模型预测处理的是概率,我们需要使用argmax函数还得到预测的结果,就是选出概率最大的,上面测试准确率的计算使用到了。

简单代码示例:

py 复制代码
import torch
# 模型输出的概率
outputs = torch.tensor([[0.1, 0.3],
                        [0.7, 0.2]])
# 真实的分类
targets = torch.tensor([[1, 1]])
# 对概率进行预测
preds = outputs.argmax(1)  # 1:横向比较 0:竖向比较

# 预测与真实进行比较
print(preds == targets)
print((preds == targets).sum().item())  # 统计正确的个数

输出:

cpp 复制代码
tensor([[ True, False]])
1
相关推荐
GarryLau1 小时前
使用pytorch进行迁移学习的两个步骤
pytorch·迁移学习·torchvision
zaim12 小时前
计算机的错误计算(一百一十四)
java·c++·python·rust·go·c·多项式
PythonFun6 小时前
Python批量下载PPT模块并实现自动解压
开发语言·python·powerpoint
醒了就刷牙6 小时前
56 门控循环单元(GRU)_by《李沐:动手学深度学习v2》pytorch版
pytorch·深度学习·gru
炼丹师小米6 小时前
Ubuntu24.04.1系统下VideoMamba环境配置
python·环境配置·videomamba
橙子小哥的代码世界6 小时前
【深度学习】05-RNN循环神经网络-02- RNN循环神经网络的发展历史与演化趋势/LSTM/GRU/Transformer
人工智能·pytorch·rnn·深度学习·神经网络·lstm·transformer
GFCGUO6 小时前
ubuntu18.04运行OpenPCDet出现的问题
linux·python·学习·ubuntu·conda·pip
985小水博一枚呀8 小时前
【深度学习基础模型】神经图灵机(Neural Turing Machines, NTM)详细理解并附实现代码。
人工智能·python·rnn·深度学习·lstm·ntm
萧鼎9 小时前
Python调试技巧:高效定位与修复问题
服务器·开发语言·python
最近好楠啊9 小时前
Pytorch实现RNN实验
人工智能·pytorch·rnn