练习3-softmax分类(李沐函数简要解析)

环境为:练习1的环境

网址为:https://www.bilibili.com/video/BV1K64y1Q7wu/?spm_id_from=333.1007.top_right_bar_window_history.content.click

代码简要解析

导入模块

导入PyTorch

导入Torch中的nn模块

导入d2l中torch模块 并命名为d2l

复制代码
import torch
from torch import nn
from d2l import torch as d2l

获取数据

从Fashion-MNIST中获取batch_size个数据 注意此处为28*28的像素图像 d2l.load_data_fashion_mnist(batch_size) 函数加载 Fashion-MNIST 数据集,并返回两个迭代器

复制代码
batch_size=100
train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size)

初始化模型和参数

Flatten()将输入为28*28的像素图像摊开成一组784长的数组 作为特征值 输入

nn.Linear() 为784输入 10输出的层

net.apply(init); 是将其中init函数作为所有可变参数的初始化方式 注意:m是层 既对每层m进行判断 符合条件对m的权重进行初始化

type(m) == nn.Linear 用于检查变量 m 是否属于 PyTorch 中的线性层(nn.Linear

复制代码
net=nn.Sequential(nn.Flatten(),nn.Linear(784,10))
def init_weights(m):
    if type(m)==nn.Linear:
            nn.init.normal_(m.weight,std=0.01)
        
net.apply(init_weights)

初始化损失函数 这里为交叉熵损失函数

复制代码
loss=nn.CrossEntropyLoss(reduction='none')

设定梯度下降算法

torch.optim.SGD()

复制代码
trainer=torch.optim.SGD(net.parameters(),lr=0.1)

训练

这里的d2l是李沐老师自己写的,想要运行成功,理论上需要把d2l下载下来

网址:https://github.com/d2l-ai/d2l-zh

复制代码
num_epochs=10;
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

我所学习到的

获得Fashion-MNIST的数据

复制代码
train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size)

对输入进行平铺处理 其本质是把每个像素点都当作特征值

复制代码
nn.Flatten()

多层的权重初始化

复制代码
net.apply(init_weights)

交叉熵损失函数

复制代码
loss=nn.CrossEntropy()
相关推荐
我的golang之路果然有问题1 小时前
mac M系列芯片 unity 安装会遇到的错误以及解决
经验分享·学习·macos·unity·游戏引擎
AI科技星2 小时前
张祥前统一场论动量公式P=m(C-V)误解解答
开发语言·数据结构·人工智能·经验分享·python·线性代数·算法
阿部多瑞 ABU3 小时前
Unicode全字符集加解密工具 - 命令行交互版:功能完整的终端解决方案
经验分享·交互·ai编程·1024程序员节
电子科技圈6 小时前
XMOS与飞腾云联袂以模块化方案大幅加速音频产品落地
经验分享·嵌入式硬件·mcu·自然语言处理·音视频·腾讯会议·游戏机
元直数字电路验证6 小时前
感知机:乳腺癌分类实现 & K 均值聚类:从零实现
均值算法·分类·聚类
油泼辣子多加8 小时前
【实战】自然语言处理--长文本分类(3)HAN算法
算法·自然语言处理·分类
01100001乄夵8 小时前
第二课:时序逻辑入门-零基础FPGA闯关教程
经验分享·笔记·学习方法
Teacher.chenchong8 小时前
生态环境影响评价图件制作:融合ArcGIS与ENVI,掌握土地利用、植被覆盖、土壤侵蚀、水系提取等专题制图技术!
经验分享
大大dxy大大15 小时前
机器学习实现逻辑回归-癌症分类预测
机器学习·分类·逻辑回归
骑猪兜风23318 小时前
2025 年的热门 AI 编程工具评测:Cursor、Claude Code、Codex、Lovable、v0 等
经验分享