神经网络-LeNet

LeNet在1990年被提出,是一系列网络的统称,包括了LeNet1~LeNet5,对于神经网络的学习者来说,大家对下面这个图一定很熟悉,该图是对LeNet的简化展示。

在LeNet中已经提出了卷积层、Pooling层等概念,只是但是由于缺乏大量数据和计算机硬件资源限制,导致LeNet的表现并不理想。

LeNet网络结构

LeNet的构成很简单,包括了基础的卷积层、池化层和全连接层,原始的LeNet使用的是灰度图像,下面示例中使用彩色图像进行说明,不影响网络的理解。

  • 定义网络层
python 复制代码
# 定义网络
class LeNet(nn.Module):                    #继承来着nn.Module的父类
    def __init__(self):  
        # 初始化网络
        #super()继承父类的构造函数,多继承需用到super函数
        super(LeNet, self).__init__()
        
        # 定义卷积层,[深度,卷积核数,卷积核大小]
        self.conv1 = nn.Conv2d(3, 16, 5)
        # 最大池化,[核大小,步长]
        self.pool1 = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(16, 32, 5)
        self.pool2 = nn.MaxPool2d(2, 2)
        # 全连接层
        self.fc1 = nn.Linear(32*5*5, 120)
        self.fc2 = nn.Linear(120, 84)
        # 根据训练项目,调整类别数
        self.fc3 = nn.Linear(84, 10)
                                     #图像参数变化
    def forward(self, x):            # input(3, 32, 32)        
        x = F.relu(self.conv1(x))    #output(16, 28, 28)
        x = self.pool1(x)            # output(16, 14, 14)
        x = F.relu(self.conv2(x))    # output(32, 10, 10)
        x = self.pool2(x)            # output(32, 5, 5)
        x = x.view(-1, 32*5*5)       # output(32*5*5)
        x = F.relu(self.fc1(x))      # output(120)
        x = F.relu(self.fc2(x))      # output(84)
        x = self.fc3(x)              # output(10)
        return x

网络结构如下,下面将对每一层做一个介绍:

网络中feature map的变化大致如下:

LeNet实例应用

  • 数据预处理
python 复制代码
# 对数据进行预处理
transform = transforms.Compose(
    [
        # 将输入的 numpy.ndarry[h*w*c]转变为[c*h*w],像素点值从[0,255],标准化为[0,1]
        transforms.ToTensor(),
        # 将数据进行标注化
        transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
    ]
)
  • 数据读取

如果是初次使用CIFAR,需要将download打开,也可以自行通过其他方式进行下载。

python 复制代码
# 读取数据-训练集
train_set = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(train_set, batch_size=36, shuffle=False, num_workers=0)
  • 定义网络

通过LeNet中的介绍,完成网络的定义。

  • 定义损失函数和优化器

pytorch支持很多损失函数和优化器,可以根据需要进行设定

python 复制代码
# 定义损失函数
loss_function = nn.CrossEntropyLoss()

# 定义优化器
optimizer = optim.Adam(net.parameters(), lr=0.001)
  • 模型训练
python 复制代码
# 开始训练,设置迭代轮次 epoch
for epoch in range(3):
    # 损失函数值
    running_loss = 0.0
    
    for step, data in enumerate(train_loader, start=0):
        inputs, labels = data
        
        # 清除梯度累加值
        optimizer.zero_grad()
        
        outputs = net(inputs.to(device))
        # 计算损失值
        loss = loss_function(outputs, labels.to(device))
        # 计算梯度
        loss.backward()
        # 参数更新
        optimizer.step()
        
        # 输出损失值
        running_loss += loss.item()
        if step % 500 == 499:
            with torch.no_grad():
                outputs = net(val_image.to(device))
                # 输出最大概率
                predict_y = torch.max(outputs, dim=1)[1]
                accuracy = (predict_y == val_label.to(device)).sum().item() / val_label.size(0)
                
                print('[%d, %5d] train_Loss:%.3f tese_accuracy: %.3f' % (epoch + 1, step + 1, running_loss/500, accuracy))
                running_loss = 0.0
                
print('train finished')
  • 保存模型
python 复制代码
# 保存模型
save_path = './Lenet.pth'
torch.save(net.state_dict(), save_path)

补充

  • Pytorch中tensor的顺序是:[batch, channel, height, width]

  • 卷积层中计算输出大小

  • W表示输入图像的Weight,一般Weight=hight

  • F表示核的大小,核大小一般为F * F

  • P表示Padding,Conv2d中默认是0

  • S表示步长

因此对于32*32的输入,在该网络中Output=(32-5+2*0)/1 +1 = 28

  • 池化层只改变特征的高和宽,不改变深度

因此对于16*28*28,经过MaxPooling后变成了16*14*14

相关推荐
wwww.bo1 天前
深度学习(5)完整版
人工智能·深度学习
yourkin6661 天前
什么是神经网络?
人工智能·深度学习·神经网络
嘀咕博客1 天前
Frames:Runway推出的AI图像生成模型,提供前所未有的风格控制和视觉一致性
人工智能·ai工具
isNotNullX1 天前
ETL详解:从核心流程到典型应用场景
大数据·数据仓库·人工智能·架构·etl
科技峰行者1 天前
通义万相2.5系列模型发布,可生成音画同步视频
人工智能·阿里云·ai·大模型·agi
Vizio<1 天前
《面向物理交互任务的触觉传感阵列仿真》2020AIM论文解读
论文阅读·人工智能·机器人·机器人触觉
尤超宇1 天前
基于卷积神经网络的 CIFAR-10 图像分类实验报告
人工智能·分类·cnn
alex1001 天前
BeaverTails数据集:大模型安全对齐的关键资源与实战应用
人工智能·算法·安全
大模型真好玩1 天前
架构大突破! DeepSeek-V3.2发布,五分钟速通DeepSeek-V3.2核心特性
人工智能·python·deepseek
春末的南方城市1 天前
苏大团队联合阿丘科技发表异常生成新方法:创新双分支训练法,同步攻克异常图像生成、分割及下游模型性能提升难题。
人工智能·科技·深度学习·计算机视觉·aigc