神经网络——优化器

1.优化器介绍:

优化器集中在torch.optim中。

  • Constructing it
python 复制代码
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
optimizer = optim.Adam([var1, var2], lr=0.0001)
  • Taking an optimization step
python 复制代码
for input, target in dataset:
    optimizer.zero_grad()
    output = model(input)
    loss = loss_fn(output, target)
    loss.backward()
    optimizer.step()

2.代码实战:

python 复制代码
import torch
import torchvision
from torch import nn
from torch.nn import Sequential, Conv2d, MaxPool2d, Flatten, Linear
from torch.utils.data import DataLoader

dataset=torchvision.datasets.CIFAR10("data",train=False,transform=torchvision.transforms.ToTensor(),
                                     download=True)

#每个批次中加载的数据项数量
dataloader=DataLoader(dataset,batch_size=1)

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()

        self.model1=Sequential(
            Conv2d(3,32,5,padding=2),
            MaxPool2d(2),
            Conv2d(32,32,5,padding=2),
            MaxPool2d(2),
            Conv2d(32,64,5,padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024,64),
            Linear(64,10)
        )

    def forward(self, x):
        x=self.model1(x)
        return x

loss=nn.CrossEntropyLoss()
tudui=Tudui()

optim=torch.optim.SGD(tudui.parameters(),lr=0.01)

for epoch in range(20):
    running_loss=0.0
    for data in dataloader:
        imgs,targets = data
        outputs =tudui(imgs)
        result_loss=loss(outputs,targets)
        #清零
        optim.zero_grad()
        result_loss.backward()
        #调优
        optim.step()
        running_loss=running_loss+result_loss
    print(running_loss)

后面loss又升高,为反向优化

3.总结:

优化器的基本使用

  • 如果要知道各个优化器的详细用法
  • 需要对其有一定了解
  • 注意要多训练几轮
相关推荐
AI2512243 分钟前
免费AI视频生成工具技术解析与功能对比
人工智能·音视频
昨夜见军贴06164 分钟前
IA-Lab AI 检测报告生成助手:贯通电磁兼容与充电桩检测,打造新能源汽车报告全链路合规新体系
人工智能·汽车
新缸中之脑8 分钟前
PufferLib高性能强化学习库
人工智能
FS_Marking8 分钟前
短距离网络10G SFP+光模块选型指南
网络·人工智能
行走的小派9 分钟前
本地跑模型+原生开源鸿蒙:拆解香橙派AI手机的12TOPS端侧硬核玩法
人工智能·开源·harmonyos
2501_948114249 分钟前
从 Claude Code 源码泄露看 2026 年 Agent 架构演进与工程化实践
大数据·人工智能·架构
小悟空9 分钟前
[AI生成]Iceberg 更新操作技术调研报告
人工智能
hughnz11 分钟前
断钻具的原因与预防
人工智能·钻井
Legend NO2415 分钟前
数据资产评估风险识别、分析与管控体系建设
大数据·人工智能·python
Bill Adams22 分钟前
如何基于Harness Engineering设计一个Agent OS
人工智能·prompt·agent·智能体·harness