【pytorch】pytorch入门4:神经网络的卷积层


文章目录


前言

使用 B站小土堆课程的笔记


一、定义概念 + 缩写

  • 卷积层是神经网络中用于突出特征来进行分类任务的层。

二、性质

  • 卷积核例子:vgg16 model

三、代码

  • 添加库
py 复制代码
python代码块import os
import torch
import torchvision # torchvision 通常用于计算机视觉任务
from torch import nn
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
  • 下载/加载数据集,加载数据
py 复制代码
# 这是一个类,用于下载和加载 CIFAR-10 数据集。CIFAR-10 是一个常用的小型图像数据集,用于训练机器学习和计算机视觉算法。它包含10个类别,每个类别有6000张32x32的彩色图像,总共有60000张图像。
# transform=torchvision.transforms.ToTensor() 转换格式
dataset = torchvision.datasets.CIFAR10("../data", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)

# load data
dataloader = DataLoader(dataset, batch_size=64)
  • 定义类,搭建简单神经网络
py 复制代码
# 搭建简单 NN
class Tudui(nn.Module):
    def __init__(self):

        # 继承
        super(Tudui, self).__init__()

        # init
        self.conv1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)

    # 卷积层
    def forward(self, x):
        x = self.conv1(x) # conv
        return x
        
# create an example
tudui = Tudui()
  • 加载到 tensorboard
py 复制代码
# log writer, write to tensorboard
writer = SummaryWriter("../logs")
  • 进行卷积
py 复制代码
# init counter
step = 0

# 循环进行卷积操作
for data in dataloader:
    imgs, targets = data
    output = tudui(imgs) # def a output
    print(imgs.shape)
    print(output.shape)
    # torch.Size([64, 3, 32, 32])

    # add img to tensorboard
    writer.add_images("input", imgs, step)
    # torch.Size([64, 6, 30, 30])  -> [xxx, 3, 30, 30]

    output = torch.reshape(output, (-1, 3, 30, 30))
    writer.add_images("output", output, step)

    # counter
    step = step + 1
  • 直接在 py 中加载 tensorboard,端口=6006;关闭 writer
py 复制代码
# open tensorboard
os.system('tensorboard --logdir=logs --port=6006')
# tensorboard --logdir="D:\Libraries\projects\python\001 learningTest and small task\a005_pytorch\a002_lesson_src\logs" --port=6006

writer.close()

总结


参考文献

[1]

相关推荐
paixiaoxin36 分钟前
CV-OCR经典论文解读|An Empirical Study of Scaling Law for OCR/OCR 缩放定律的实证研究
人工智能·深度学习·机器学习·生成对抗网络·计算机视觉·ocr·.net
OpenCSG1 小时前
CSGHub开源版本v1.2.0更新
人工智能
weixin_515202491 小时前
第R3周:RNN-心脏病预测
人工智能·rnn·深度学习
Altair澳汰尔1 小时前
数据分析和AI丨知识图谱,AI革命中数据集成和模型构建的关键推动者
人工智能·算法·机器学习·数据分析·知识图谱
机器之心1 小时前
图学习新突破:一个统一框架连接空域和频域
人工智能·后端
AI视觉网奇1 小时前
人脸生成3d模型 Era3D
人工智能·计算机视觉
call me by ur name1 小时前
VLM--CLIP作分类任务的损失函数
人工智能·机器学习·分类
吃个糖糖2 小时前
34 Opencv 自定义角点检测
人工智能·opencv·计算机视觉
禁默2 小时前
2024年图像处理、多媒体技术与机器学习
图像处理·人工智能·microsoft
KeepThinking!2 小时前
YOLO-World:Real-Time Open-Vocabulary Object Detection
人工智能·yolo·目标检测·多模态