nn.Conv2d(二)

**前置知识:

1、nn.Conv2d和torch.nn.functional.conv2d的对比:

nn.Conv2d(能自主学习,更新调整卷积核)

  • 模块:可以看作是一个"卷积层",用在神经网络里。
  • 定义一次,用多次:你只需设置好参数(比如输入通道、输出通道、卷积核大小),然后在每次前向传播时直接用它。
  • 自动管理:这个模块会自动保存和更新卷积的权重(参数),你只需关注模型的整体结构。

torch.nn.functional.conv2d(一次性使用,卷积核的参数需要人为给好给全)

  • 函数:可以想象成一个工具,用来执行一次性的卷积操作。
  • 灵活使用 :每次使用时都要提供所有需要的参数,比如输入数据、卷积核的权重和偏置。
  • 无状态:这个函数不会保存卷积的参数,所以你得自己管理这些。

2、self.conv_1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)

定义了一个卷积层,输入为 3 通道的图像,经过 3x3 的卷积核处理后,输出 6 通道的特征图

in_channels=3

  • 输入通道数:这里设置为 3,表示输入的图像有 3 个通道(例如 RGB 彩色图像)。每个通道对应图像中的一种颜色。

out_channels=6

  • 输出通道数:设置为 6,表示该卷积层会输出 6 个通道的特征图。这意味着卷积层会学习到 6 种不同的特征。

kernel_size=3

  • 卷积核大小:设置为 3,表示卷积核的尺寸为 3x3 像素。卷积核在输入图像上滑动,进行局部特征的提取。

stride=1

  • 步幅:设置为 1,表示卷积核每次滑动一个像素。步幅越小,输出特征图的尺寸越大。

padding=0

  • 填充:设置为 0,表示不对输入图像进行填充。没有填充会使输出特征图的尺寸减小。

**代码:

加载数据集------>数据Loader处理------>创建新神经网络模型(继承nn.Module并重写方法)------>数据输入reshape成4维度张量------>使用该模型进行计算------>数据结果reshape成3通道------>tensorboard记录

python 复制代码
import torch
import torchvision
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_set=torchvision.datasets.CIFAR10(root="./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)

dataloader=DataLoader(test_set,batch_size=64)

class Xigua(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv_1=Conv2d(in_channels=3,out_channels=6,kernel_size=3,stride=1,padding=0)

    def forward(self,input):
        output=self.conv_1(input)
        return output

xigua1=Xigua()
print(xigua1)
#Xigua((conv_1): Conv2d(3, 6, kernel_size=(3, 3), stride=(1, 1)))

writer=SummaryWriter("logs1")
step=0
for data in dataloader:
    imgs,targets=data
    output=xigua1(imgs)
    print(imgs.shape) #torch.Size([64, 3, 32, 32])
    print(output.shape) #torch.Size([64, 6, 30, 30])
    #需要reshape,使其变为3通道,才能使add_imgs生效,torch.Size([64, 6, 30, 30])------------>torch.Size([***, 3, 30, 30])
    output=torch.reshape(output,(-1,3,30,30)) #-1是一个占位符,表示让pytorch自动计算该维度的大小
    writer.add_images("test_Conv2d",output,step,dataformats="NCHW")
    writer.add_images("start",imgs,step,dataformats="NCHW")
    step=step+1
    if step>=10:
        break
writer.close()


# AssertionError: assert I.ndim == 4 and I.shape[1] == 3
相关推荐
青云交30 分钟前
Java 大视界 -- Java 大数据机器学习模型在智能客服多轮对话系统中的优化策略
深度学习·自然语言处理·智能客服·数据预处理·机器学习模型·java 大数据·多轮对话系统
九皇叔叔1 小时前
Java循环结构全解析:从基础用法到性能优化(含经典案例)
java·开发语言·python
chxin140161 小时前
优化算法——动手学深度学习11
pytorch·python·深度学习
孤独野指针*P2 小时前
深度学习之美》读书笔记 - 第一章 & 第二章
人工智能·深度学习
闲人编程2 小时前
使用Python操作你的手机(Appium入门)
python·智能手机·appium·自动化·codecapsule·处理弹窗
大象耶2 小时前
Mamba与UNet融合的创新架构方向
论文阅读·人工智能·深度学习·计算机网络·机器学习
汤姆yu2 小时前
基于python大数据深度学习的酒店评论文本情感分析
开发语言·python·深度学习
遇雪长安2 小时前
深度学习YOLO实战:5、基于YOLO的自动化图像批量检测方案
人工智能·深度学习·yolo
浆果02072 小时前
【图像卷积基础】卷积过程&卷积实现通道扩充与压缩&池化Pooling原理和可视化
深度学习·神经网络·计算机视觉
拓端研究室2 小时前
Python电力负荷预测:LSTM、GRU、DeepAR、XGBoost、Stacking、ARIMA结合多源数据融合与SHAP可解释性的研究
python·gru·lstm