【pytorch】pytorch入门4:神经网络的卷积层


文章目录


前言

使用 B站小土堆课程的笔记


一、定义概念 + 缩写

  • 卷积层是神经网络中用于突出特征来进行分类任务的层。

二、性质

  • 卷积核例子:vgg16 model

三、代码

  • 添加库
py 复制代码
python代码块import os
import torch
import torchvision # torchvision 通常用于计算机视觉任务
from torch import nn
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
  • 下载/加载数据集,加载数据
py 复制代码
# 这是一个类,用于下载和加载 CIFAR-10 数据集。CIFAR-10 是一个常用的小型图像数据集,用于训练机器学习和计算机视觉算法。它包含10个类别,每个类别有6000张32x32的彩色图像,总共有60000张图像。
# transform=torchvision.transforms.ToTensor() 转换格式
dataset = torchvision.datasets.CIFAR10("../data", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)

# load data
dataloader = DataLoader(dataset, batch_size=64)
  • 定义类,搭建简单神经网络
py 复制代码
# 搭建简单 NN
class Tudui(nn.Module):
    def __init__(self):

        # 继承
        super(Tudui, self).__init__()

        # init
        self.conv1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)

    # 卷积层
    def forward(self, x):
        x = self.conv1(x) # conv
        return x
        
# create an example
tudui = Tudui()
  • 加载到 tensorboard
py 复制代码
# log writer, write to tensorboard
writer = SummaryWriter("../logs")
  • 进行卷积
py 复制代码
# init counter
step = 0

# 循环进行卷积操作
for data in dataloader:
    imgs, targets = data
    output = tudui(imgs) # def a output
    print(imgs.shape)
    print(output.shape)
    # torch.Size([64, 3, 32, 32])

    # add img to tensorboard
    writer.add_images("input", imgs, step)
    # torch.Size([64, 6, 30, 30])  -> [xxx, 3, 30, 30]

    output = torch.reshape(output, (-1, 3, 30, 30))
    writer.add_images("output", output, step)

    # counter
    step = step + 1
  • 直接在 py 中加载 tensorboard,端口=6006;关闭 writer
py 复制代码
# open tensorboard
os.system('tensorboard --logdir=logs --port=6006')
# tensorboard --logdir="D:\Libraries\projects\python\001 learningTest and small task\a005_pytorch\a002_lesson_src\logs" --port=6006

writer.close()

总结


参考文献

1

相关推荐
OAFD.15 小时前
深度学习之图像分割:从基础概念到核心技术全解析
人工智能·深度学习
武子康15 小时前
AI研究-116 特斯拉 HW3.0 与 HW4.0 区别详解:摄像头分辨率、FSD算力、雷达与Vision泊车
人工智能·深度学习·计算机视觉·ai·自动驾驶·汽车·视觉检测
Mrliu__15 小时前
Opencv(六) : 颜色识别
人工智能·opencv·计算机视觉
Liudef0615 小时前
基于LLM的智能数据查询与分析系统:实现思路与完整方案
前端·javascript·人工智能·easyui
芥子沫15 小时前
《人工智能基础》[算法篇3]:决策树
人工智能·算法·决策树
Y2003091615 小时前
U-net 系列算法总结
人工智能·算法·目标跟踪
努力犯错15 小时前
Google Veo 3.1 提示词生成器:让 AI 视频创作效率翻倍的免费工具
人工智能·计算机视觉·语言模型·开源·音视频
SmartBrain16 小时前
深入洞察:昇腾 AI 生态的CANN/MindSpore架构
人工智能
长桥夜波16 小时前
机器学习日报09
人工智能·机器学习
Liudef0616 小时前
基于Java的LLM长上下文数据预处理方案:实现128k上下文智能数据选择
java·开发语言·人工智能