一起深度学习(AlexNet网络)

AlexNet神经网络

代码实现:

python 复制代码
import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
    # 采用了11*11的卷积核来捕捉对象,因为原始输入数据比较大
    #步幅为4 ,可减少输出的高度核宽度。
    #输出通道为96,远大于Lenet
    #卷积之后大小的计算:H_2 = (H_1 + 2 * padding - kernel_size) / stride + 1,向下取整
    # 因为这里我们用的数据是fahsion_mnist ,输入通道就为1
    # [1,224,224] => [1,96,54,54]
    nn.Conv2d(in_channels=1,out_channels=96,kernel_size=11,stride=4,padding=1),nn.ReLU(),
    #池化后的大小计算公式:H_2 = (H1 + 2 * padding - kernel_size) / stride + 1
    # [1,96,54,54] => [1,96,26,26]
    nn.MaxPool2d(kernel_size=3,stride=2),
    #减小卷积窗口大小,使用padding = 2 来保证输入与输出的宽高一致,且增大输出通道。
    # [1,96,26,26] => [1,256,26,26]  H2=(26 + 2*2 -5)/1 +1
    nn.Conv2d(in_channels=96,out_channels=256,kernel_size=5,padding=2),nn.ReLU(),
    #[1,256,26,26] => [1,256,12,12]
    nn.MaxPool2d(kernel_size=3,stride=2),
    #三个卷积层
    # [1,256,12,12] => [1,384,12,12]
    nn.Conv2d(256,384, kernel_size=3, padding=1),nn.ReLU(),
    # [1,384,12,12]  =>  [1,384,12,12]
    nn.Conv2d(384,384, kernel_size=3, padding=1),nn.ReLU(),
    # [1,384,12,12] => [1,,256,12,12]
    nn.Conv2d(384,256, kernel_size=3, padding=1),nn.ReLU(),
    #[1,,256,12,12] => [1,256,5,5] 因为 H2 = (12 -3 )/2 +1 = 5
    nn.MaxPool2d(kernel_size=3, stride=2),
    #输入数据打平,传送给全连接层.
    nn.Flatten(),  # 256 * 5 * 5 = 6400
    # 由于输入的数据过大,远远大于leNet网络,为了避免过拟合,可采用 dropout
    nn.Linear(6400,4096),nn.ReLU(),
    nn.Dropout(p=0.5),
    nn.Linear(4096,4096),nn.ReLU(),
    nn.Dropout(p=0.5),
    nn.Linear(4096,10)
)

#加载数据集
batch_size = 128
train_iter,test_iter = d2l.load_data_fashion_mnist(batch_size,resize=224)

#训练模型:

#开始训练
lr,num_epochs = 0.01,10
d2l.train_ch6(net,train_iter,test_iter,num_epochs,lr,d2l.try_gpu())
相关推荐
小二·12 分钟前
Python Web 开发进阶实战 :AI 原生数字孪生 —— 在 Flask + Three.js 中构建物理世界实时仿真与优化平台
前端·人工智能·python
Whisper_Sy31 分钟前
Flutter for OpenHarmony移动数据使用监管助手App实战 - 网络状态实现
android·java·开发语言·javascript·网络·flutter·php
chinesegf35 分钟前
文本嵌入模型的比较(一)
人工智能·算法·机器学习
哥布林学者44 分钟前
吴恩达深度学习课程五:自然语言处理 第二周:词嵌入 课后习题与代码实践
深度学习·ai
珠海西格电力1 小时前
零碳园区的能源结构优化需要哪些技术支持?
大数据·人工智能·物联网·架构·能源
Black蜡笔小新1 小时前
视频汇聚平台EasyCVR打造校园消防智能监管新防线
网络·人工智能·音视频
珠海西格电力科技1 小时前
双碳目标下,微电网为何成为能源转型核心载体?
网络·人工智能·物联网·云计算·智慧城市·能源
2501_941837261 小时前
【计算机视觉】基于YOLOv26的交通事故检测与交通状况分析系统详解_1
人工智能·yolo·计算机视觉
HyperAI超神经1 小时前
加州大学构建基于全连接神经网络的片上光谱仪,在芯片级尺寸上实现8纳米的光谱分辨率
人工智能·深度学习·神经网络·机器学习·ai编程
badfl1 小时前
AI漫剧技术方案拆解:NanoBanana+Sora视频生成全流程
人工智能·ai·ai作画