pytorch学习9-优化器学习

系列文章目录

  1. pytorch学习1-数据加载以及Tensorboard可视化工具
  2. pytorch学习2-Transforms主要方法使用
  3. pytorch学习3-torchvisin和Dataloader的使用
  4. pytorch学习4-简易卷积实现
  5. pytorch学习5-最大池化层的使用
  6. pytorch学习6-非线性变换(ReLU和sigmoid)
  7. pytorch学习7-序列模型搭建
  8. pytorch学习8-损失函数与反向传播
  9. pytorch学习9-优化器学习
  10. pytorch学习10-网络模型的保存和加载
  11. pytorch学习11-完整的模型训练过程

文章目录


一、优化器使用

python 复制代码
import torch.optim
import torchvision
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Sequential, Flatten, Linear
from torch.utils.data import DataLoader

dataset=torchvision.datasets.CIFAR10("data",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader=DataLoader(dataset,batch_size=1)

class Mynn(nn.Module):
    #这是使用序列的方法:
    def __init__(self):
        super(Mynn,self).__init__()
        self.model1=Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )
    def forward(self,x):
        x=self.model1(x)
        return x

mynn=Mynn()
loss=nn.CrossEntropyLoss()
optim=torch.optim.SGD(mynn.parameters(),lr=0.01)#调用SGD优化器。第一个参数是把模型的参数全输入进去

for epoch in range(20):
    runing_loss=0.0
    for data in dataloader:
        imgs,target=data
        outputs=mynn(imgs)
        result_loss=loss(outputs,target)
        optim.zero_grad()#将上一次的梯度设置为0,这一步必须做
        result_loss.backward()#反向传播,计算出模型的参数
        optim.step()#进行完反向传播之后,模型的参数就计算出来了,就可以调用优化器了
        runing_loss=runing_loss+result_loss
    print(runing_loss)#查看每一轮的损失之和

总结

以上就是今天要讲的内容,优化器的使用

相关推荐
九章云极AladdinEdu1 小时前
GPU与NPU异构计算任务划分算法研究:基于强化学习的Transformer负载均衡实践
java·开发语言·人工智能·深度学习·测试工具·负载均衡·transformer
量子-Alex1 小时前
【目标检测】RT-DETR
人工智能·目标检测·计算机视觉
2201_754918411 小时前
OpenCV 图像透视变换详解
人工智能·opencv·计算机视觉
threelab1 小时前
12.three官方示例+编辑器+AI快速学习webgl_buffergeometry_indexed
学习·编辑器·webgl
羽星_s1 小时前
文本分类任务Qwen3-0.6B与Bert:实验见解
人工智能·bert·文本分类·ai大模型·qwen3
jerry6091 小时前
LLM笔记(六)线性代数
笔记·学习·线性代数·自然语言处理
摸鱼仙人~1 小时前
TensorFlow/Keras实现知识蒸馏案例
人工智能·tensorflow·keras
ghost1431 小时前
C#学习第23天:面向对象设计模式
开发语言·学习·设计模式·c#
浊酒南街1 小时前
TensorFlow之微分求导
人工智能·python·tensorflow
羽凌寒1 小时前
曝光融合(Exposure Fusion)
图像处理·人工智能·计算机视觉