神经网络——优化器

1.优化器介绍:

优化器集中在torch.optim中。

  • Constructing it
python 复制代码
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
optimizer = optim.Adam([var1, var2], lr=0.0001)
  • Taking an optimization step
python 复制代码
for input, target in dataset:
    optimizer.zero_grad()
    output = model(input)
    loss = loss_fn(output, target)
    loss.backward()
    optimizer.step()

2.代码实战:

python 复制代码
import torch
import torchvision
from torch import nn
from torch.nn import Sequential, Conv2d, MaxPool2d, Flatten, Linear
from torch.utils.data import DataLoader

dataset=torchvision.datasets.CIFAR10("data",train=False,transform=torchvision.transforms.ToTensor(),
                                     download=True)

#每个批次中加载的数据项数量
dataloader=DataLoader(dataset,batch_size=1)

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()

        self.model1=Sequential(
            Conv2d(3,32,5,padding=2),
            MaxPool2d(2),
            Conv2d(32,32,5,padding=2),
            MaxPool2d(2),
            Conv2d(32,64,5,padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024,64),
            Linear(64,10)
        )

    def forward(self, x):
        x=self.model1(x)
        return x

loss=nn.CrossEntropyLoss()
tudui=Tudui()

optim=torch.optim.SGD(tudui.parameters(),lr=0.01)

for epoch in range(20):
    running_loss=0.0
    for data in dataloader:
        imgs,targets = data
        outputs =tudui(imgs)
        result_loss=loss(outputs,targets)
        #清零
        optim.zero_grad()
        result_loss.backward()
        #调优
        optim.step()
        running_loss=running_loss+result_loss
    print(running_loss)

后面loss又升高,为反向优化

3.总结:

优化器的基本使用

  • 如果要知道各个优化器的详细用法
  • 需要对其有一定了解
  • 注意要多训练几轮
相关推荐
zzgnbfd65881 分钟前
2026最新vibe coding入门实战:零基础快速落地全流程实测
人工智能·microsoft
2601_956865772 分钟前
2026电商内容创作工具推荐:AI生成电商短视频的工具有哪些,哪个最划算?
人工智能·aigc
happyness443 分钟前
如何通过其他AI蒸馏出自己的大模型
人工智能
2603_9552797017 分钟前
凝视与遗忘:AI如何定义记忆
人工智能
MartinYeung533 分钟前
[论文学习] CAMIA:下文感知成员推理攻击
人工智能·深度学习·学习
IT_陈寒33 分钟前
Python多线程的坑,我居然现在才踩到
前端·人工智能·后端
直接冲冲冲36 分钟前
59-VGG
深度学习·神经网络·cnn
云边云科技_云网融合1 小时前
零信任安全:数字化时代的企业防护新范式
人工智能·安全·ai
万岳科技系统开发1 小时前
外卖跑腿配送系统如何借助AI提升配送效率?
大数据·人工智能·机器学习
thinking_talk1 小时前
腾讯云AI Agent安全中心综合评测
人工智能·安全·腾讯云