学习pytorch9 神经网络-卷积层

神经网络-卷积层

官网

https://pytorch.org/docs/stable/nn.html#convolution-layers

图像识别常用conv2d 二维卷积 nn.Conv2d
https://pytorch.org/docs/stable/generated/torch.nn.Conv2d.html#torch.nn.Conv2d

卷积数据公式


参数说明

Parameters:

  • in_channels (int) -- Number of channels in the input image 输入通道

  • out_channels (int) -- Number of channels produced by the convolution 输出通道

  • kernel_size (int or tuple) -- Size of the convolving kernel 卷积核大小

  • stride (int or tuple, optional) -- Stride of the convolution. Default: 1 每次卷积走多少步,横向纵向的步径大小

  • padding (int, tuple or str, optional) -- Padding added to all four sides of the input. Default: 0 是否在卷积过程中对输入图像的边缘进行填充

  • padding_mode (str, optional) -- 'zeros', 'reflect', 'replicate' or 'circular'. Default: 'zeros' 填充数据的模式是什么,默认为zeros,填充的都是0

  • dilation (int or tuple, optional) -- Spacing between kernel elements. Default: 1 卷积核中间的距离? 一般不改 不常用

  • groups (int, optional) -- Number of blocked connections from input channels to output channels. Default: 1 一般不改 不常用

  • bias (bool, optional) -- If True, adds a learnable bias to the output. Default: True 添加偏置值,默认为True添加偏置值

卷积运算演示

https://github.com/vdumoulin/conv_arithmetic/blob/master/README.md

绿色方格:表示输出图像

蓝色方格:表示输入图像

蓝色方格中的深色阴影部分:表示kernel 卷积核

白色虚线:表示padding填充

动画中深色阴影上下左右整体移动的方格数,表示stride的大小

输入输出channel

两个卷积核做两次卷积,叠加输出一起是out_channel=2

代码

注意点:

  1. super()括号里面没有内容,自动填充的self应该去掉
py 复制代码
super().__init__() 

code

py 复制代码
import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_set = torchvision.datasets.CIFAR10(root='./dataset', train=False, transform=torchvision.transforms.ToTensor(), download=True)

dataloader = DataLoader(test_set, batch_size=64, shuffle=False)

class NnConv2d(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)

    def forward(self, x):
        x = self.conv1(x)
        return x

nnconvd = NnConv2d()
writer = SummaryWriter('./logs')
step = 0
for data in dataloader:
    imgs, targets = data
    output = nnconvd(imgs)
    print(imgs.shape)
    print(output.shape)
    writer.add_images("input", imgs)
    output = output.reshape([-1, 3, 30, 30])
    writer.add_images("output", output)
    step += 1

执行结果

sh 复制代码
......
torch.Size([64, 6, 30, 30])
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])
torch.Size([16, 3, 32, 32])
torch.Size([16, 6, 30, 30])  # 最后一个batch16是因为drop_last默认为False,最后没除尽的也要保留,参与训练
相关推荐
sp_fyf_20242 分钟前
人工智能-大语言模型-微调技术-LoRA及背后原理简介
人工智能·语言模型·自然语言处理
RaidenQ6 分钟前
2024.9.20 Python模式识别新国大EE5907,PCA主成分分析,LDA线性判别分析,GMM聚类分类,SVM支持向量机
python·算法·机器学习·支持向量机·分类·聚类
xuehaishijue7 分钟前
射击靶标检测系统源码分享
人工智能·计算机视觉·目标跟踪
Kenneth風车10 分钟前
【机器学习(九)】分类和回归任务-多层感知机 (MLP) -Sentosa_DSML社区版
人工智能·算法·低代码·机器学习·分类·数据分析·回归
_平凡之路_13 分钟前
解决ubuntu22.04 gnome-terminal 无法启动的问题
linux·运维·python
知来者逆13 分钟前
ChemChat——大语言模型与化学的未来,以及整合外部工具和聊天机器人的潜力
人工智能·gpt·语言模型·自然语言处理·机器人·llm·大语言模型
AI领航者14 分钟前
大型语言模型的结构性幻觉:不可避免的局限性
人工智能·语言模型·自然语言处理·llm·大语言模型·ai大模型·大模型幻觉
fydw_71514 分钟前
PyTorch 池化层详解
人工智能·深度学习
豆本-豆豆奶16 分钟前
23个Python在自然语言处理中的应用实例
开发语言·python·自然语言处理·编程语音
NiNg_1_23420 分钟前
机器学习之Python中Scikit-Learn(sklearn)入门
python·机器学习·scikit-learn