模型训练套路(一)

一、训练完整使用网络模型

import torch

import torchvision

from torch import nn

from torch.utils.data import DataLoader
from model1 import* # 此处的引用为此文在实现过程中所解决的问题

train_data = torchvision.datasets.CIFAR10(root = "../data", train=True,

transform=torchvision.transforms.ToTensor(),download=True)

test_data = torchvision.datasets.CIFAR10(root = "../data", train=False,

transform=torchvision.transforms.ToTensor(),download=True)

查看数据集的长度

train_data_size = len(train_data)

test_data_size = len(test_data)

格式化 # 格式化注意的是,之间是.的连接

print("训练数据集的长度为: {}".format(train_data_size))

print("测试数据集的长度为: {}".format(test_data_size))

利用dataloade r加载数据集#加载数据集的参数设置

train_dataloader = DataLoader (train_data, batch_size=64)

test_dataloader = DataLoader(test_data, batch_size=64)

创建网络模型

sun = SUN()

损失函数 交叉熵函数的使用

loss_fn = nn.CrossEntropyLoss()

优化器(SGD随机梯度下降)

learning_rate = 0.01

optimizer = torch.optim.SGD(sun.parameters(), lr = learning_rate)

设置网络训练的参数

记录训练的次数

total_train_step = 0

记录测试的次数

total_test_step = 0

训练的轮数

epoch = 10

for i in range**(epoch)**:

print("-------第{}轮训练开始--------".format(i+1))

训练网络模型,从训练的data中取数据

训练步骤开始

for data in train_dataloader:

imgs, targets = data

outputs = sun(imgs)

将得到的输出与真实的target比较,得到误差

loss =loss_fn(outputs, targets)

优化器优化模型

进行优化,首先是梯度清零

optimizer.zero_grad()

得到每个节点的梯度

loss.backward()

对其中的参数进行优化

optimizer.step()

total_test_step = total_test_step + 1

print("训练次数:{}, Loss: {}".format(total_test_step, loss.item()))

二、调用的神经网络模型

复制代码
import torch
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential


class SUN(nn.Module):
    def __init__(self):
        super(SUN, self).__init__()
       self.model = nn.Sequential(
            nn.Conv2d(3, 32, 5, 1, 2),
           nn.MaxPool2d(2),
          nn.Conv2d(32, 32, 5, 1, 2),
            nn.MaxPool2d(2),
           nn.Conv2d(32, 64, 5, 1, 2),
           nn.MaxPool2d(2),
            nn.Flatten(),
         nn.Linear(1024, 64),
           nn.Linear(64, 10)
        )

    def forward(self, x):
        x =self.model(x)
        return x



if __name__ == '__main__':
    sun = SUN()
    input = torch.ones((64, 3, 32,32))
    output = sun(input)
    print(output.shape)

三、调用python文件

在调用的python文件时,会出现一些问题:

python 复制代码
from model1 import*

使用该语句调用,但是model1会画红色波浪线报错,并且,引用的神经网络也会出现报错,原因就是,未正确引用py文件。

尝试的解决办法:使用.model1,这种办法不可取后;

使用标记目录仍未成功;

最终,神经网络的py文件与训练的该文件在同一目录下,将被引用的Py文件,放在需引用文件的上一级目录下。也就是说,被引用文件在需引用文件的上一级。

接套路一代码:

复制代码
# 如何知道数据训练好了没有
# 利用现有模型进行测试
# 在测试数据集上走一遍,以测试数据集的损失,来判定模型训练好了没有
# 测试过程中不需要在对模型进行调优
# 测试步骤开始
复制代码
    total_test_loss = 0
   with torch.no_grad(): # 将参数梯度调零
        for data in test_dataloader:
            imgs, targets = data
            outputs = sun(imgs)
            loss =loss_fn(outputs, targets)
            total_test_loss = total_test_loss + loss.item()

        print("整体测试集上的Loss:{}".format(total_test_loss))

        writer.add_scalar("test_loss",total_test_loss, total_train_step)
        total_test_step +=1

对模型的保存

复制代码
        torch.save(sun, "sun_{}.path".format(i))
        print("模型已保存")

writer.close()

在tensorboard上显示:

经过10轮的训练,测试集与训练集的损失值变化。

输出(outputs)与最终的预测(predicts)之间的转变,使用函数Argmax,就能够求出横向的最大值所在的位置。

相关推荐
HyperAI超神经2 分钟前
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模
人工智能·3d·大模型·多模态·空间推理·3d感知·3d理解
Hello:CodeWorld3 分钟前
Dify 从入门到实战:部署、模型对接与企业级 AI 应用开发全教程
人工智能·python·架构·ai编程
AllData公司负责人9 分钟前
大模型赋能AllData数据中台,系列升级|通过联合智谱大模型与Chat2DB开源项目,建设Text2SQL生产场景全新体验的数据源平台!
数据库·人工智能·text2sql·数据中台·数据源·chat2db·智谱大模型
xinlianyq14 分钟前
2026 电商视觉红海突围:核心 AI 视频与海报创作工具实战选型指南
人工智能·aigc
Deepoch16 分钟前
Deepoc VLA开发板:除草机器人的持续学习与协同作业系统
人工智能·学习·机器人·开发板·具身模型·deepoc
生成论实验室22 分钟前
判断力与六十四卦:AI的第三块基石
人工智能·语言模型·机器人·自动驾驶·安全架构
xixixi7777724 分钟前
空天地通信、高速光模块、AI 智能体攻击、同态加密芯片四大事件解读:AI 算力底座攻防与全域通信同步升级
大数据·人工智能·深度学习·ai·大模型·光模块·智能体
水木流年追梦31 分钟前
大模型入门-大模型优化方法13- MTP 多 token 输出、DCA 双块注意力
人工智能·分布式·算法·正则表达式·prompt
快乐得小萝卜31 分钟前
论文:π0.5
笔记·深度学习
雪隐32 分钟前
AI股票小助手06-Backtrader 量化回测
人工智能·后端