【PyTorch】神经网络的基本骨架-nn.Module的使用以及convolution-layers卷积层介绍

前提文章目录

【PyTorch】深度学习PyTorch环境配置及安装【详细清晰】
【PyTorch】深度学习PyTorch加载数据
【PyTorch】关于Tensorboard的简单使用
【PyTorch】关于Transforms的简单使用
【PyTorch】关于torchvision中的数据集以及dataloader的使用


文章目录

nn.Module的使用

nn:Neural network 神经网络

官网链接:https://pytorch.org/docs/1.8.1/nn.html

Containers骨架Module链接:https://pytorch.org/docs/1.8.1/generated/torch.nn.Module.html#torch.nn.Module



程序中的基本使用:

python 复制代码
import torch
from torch import nn


# 创建神经网络模板   debug不会进行执行 除非调用它才会进行执行
class testModel(nn.Module):
    def __init__(self):
        super().__init__()

    def forward(self, input):
        output = input + 1  # 给一个输入直接将其输出
        return output


# 创建神经网络
testModel = testModel()   #进行debug 这是程序的开始
x = torch.tensor(1.0)
output = testModel(x)
print(output)

convolution-layers卷积层

convolution-layers链接:https://pytorch.org/docs/1.8.1/nn.html#convolution-layers

Conv2d

链接:https://pytorch.org/docs/1.8.1/nn.functional.html#conv2d

参数介绍:

  • input:输入
  • weight:权重。卷积核
  • bias:偏置
  • stride:卷积核移动的步长。可以是一个数字或一个元组(sH、sW)。默认值:1 。 sH、sW :控制横向的移动和控制纵向的移动
  • padding:填充
  • dilation:扩张 。内核元素之间的间距
  • groups:组别

卷积后的输出计算:
Stride步长设置:

用程序计算表示:

python 复制代码
import torch
import torch.nn.functional as F

# 输入数据是二维图像(2维矩阵)  看连续的([[)中括号数,有几个就是几维矩阵
input = torch.tensor([[1, 2, 0, 3, 1],  # 输入图像的第一行
                      [0, 1, 2, 3, 1],
                      [1, 2, 1, 0, 0],
                      [5, 2, 3, 1, 1],
                      [2, 1, 0, 1, 1]])

kernel = torch.tensor([[1, 2, 1],
                       [0, 1, 0],
                       [2, 1, 0]])

# print(input.shape)  # torch.Size([5, 5])   只有高和宽
# print(kernel.shape)  # torch.Size([3, 3])

# 因为文档的输入是需要四个参数  所以这里用torch提供的尺寸变换
# 要求的是一个输入,所以放入input
# (1,1,5,5):需要变换成的样子   batch_size为1:只取一个样本; channel为1:二维灰度图  5,5: 是5x5的图像输入
input = torch.reshape(input, (1, 1, 5, 5))
kernel = torch.reshape(kernel, (1, 1, 3, 3))

print(input.shape)  # torch.Size([1, 1, 5, 5])
print(kernel.shape)  # torch.Size([1, 1, 3, 3])

output = F.conv2d(input, kernel, stride=1)
print(output)

# 步长(步径)为2
output2 = F.conv2d(input, kernel, stride=2)
print(output2)

运行结果:

解释说明:

灰度图用2维矩阵表示,通道数channel为1。彩色图用3维矩阵表示,通道数为2。

padding填充设置:

程序计算:

python 复制代码
# padding为1
output3 = F.conv2d(input, kernel, stride=1, padding=1)
print(output3)

输出结果:

可以看到输出结果的尺寸变大。

相关推荐
老成说AI2 分钟前
DEEPSEEK V4 实测:它不够炸裂,但正在啃最硬的骨头
人工智能·ai·deepseek
Wanderer X3 分钟前
【LLM】GSPO DAPO
人工智能
IpdataCloud4 分钟前
IP查询工具的准确率怎么评估?一份可上生产的选型与验收指南
网络·人工智能·算法
大龄码农-涵哥12 分钟前
Java调用AI大模型API入门:从零开始接入ChatGPT/通义千问
java·人工智能·chatgpt
沫儿笙13 分钟前
焊接机器人弧焊节气设备
人工智能·机器人
人工智能AI技术14 分钟前
网络协议基础:三次握手、四次挥手通俗讲解
人工智能
疯狂成瘾者14 分钟前
大模型与后端如何协作?
人工智能
人工智能AI技术21 分钟前
后端、前端、测试转大模型,哪个方向性价比最高
人工智能
AI 编程助手GPT21 分钟前
【深度】GPT-5.5 重新定义编程、Copilot 转向 Token 计费、大模型进入“雅尔塔时刻“——2026 年 4 月 28 日 AI 编程三大变局
人工智能·gpt·ai·chatgpt·copilot·ai编程·#程序员效率
TG_yunshuguoji21 分钟前
云代理商:DeepSeek V4 重塑云服务 AI 格局 推理成本直降
人工智能·云计算·ai智能体·deepseek v4