PyTorch中,卷积层、池化层、转置卷积层输出特征图形状计算公式总结

在PyTorch中,卷积层(Convolutional Layer)、池化层(Pooling Layer,例如最大池化层)、以及转置卷积层(Transpose Convolutional Layer,也称为反卷积层或上采样层)的输出特征图形状可以根据输入特征图的形状和各层的参数计算输出。

假设输入特征图的形状为 (in_channel, in_height, in_width),以下是各层输出特征图形状的计算公式:

1. 卷积层(Convolutional Layer)输出特征图形状计算公式:

py 复制代码
out_channel = 卷积核的数量
out_height  = (in_height + 2 * padding - kernel_size) / stride + 1
out_width   = (in_width  + 2 * padding - kernel_size) / stride + 1

2. 池化层(Pooling Layer)输出特征图形状计算公式:

py 复制代码
out_channel = in_channel
out_height  = (in_height - kernel_size) / stride + 1
out_width   = (in_width  - kernel_size) / stride + 1

3. 转置卷积层(Transpose Convolutional Layer)输出特征图形状计算公式:

py 复制代码
out_channel = 卷积核的数量
out_height  = stride * (in_height - 1) + kernel_size - 2 * padding
out_width   = stride * (in_width  - 1) + kernel_size - 2 * padding
csharp 复制代码
如果步幅为s,填充为s/2(假设s/2是整数)且卷积核的高和宽为2s,转置卷积核会将输入的高和宽分别放大s倍

这些公式适用于PyTorch中的卷积、池化和转置卷积层,可以根据具体的网络架构和参数进行计算。

注意,PyTorch中的卷积层和池化层通常作为nn.Conv2dnn.MaxPool2d等模块提供,参数传递方式也要根据实际情况来设置。

相关推荐
昨日之日200639 分钟前
Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载
人工智能·whisper·语音识别
浮生如梦_41 分钟前
Halcon基于laws纹理特征的SVM分类
图像处理·人工智能·算法·支持向量机·计算机视觉·分类·视觉检测
深度学习lover42 分钟前
<项目代码>YOLOv8 苹果腐烂识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·苹果腐烂识别
热爱跑步的恒川2 小时前
【论文复现】基于图卷积网络的轻量化推荐模型
网络·人工智能·开源·aigc·ai编程
API快乐传递者2 小时前
淘宝反爬虫机制的主要手段有哪些?
爬虫·python
阡之尘埃4 小时前
Python数据分析案例61——信贷风控评分卡模型(A卡)(scorecardpy 全面解析)
人工智能·python·机器学习·数据分析·智能风控·信贷风控
孙同学要努力6 小时前
全连接神经网络案例——手写数字识别
人工智能·深度学习·神经网络
Eric.Lee20216 小时前
yolo v5 开源项目
人工智能·yolo·目标检测·计算机视觉
其实吧37 小时前
基于Matlab的图像融合研究设计
人工智能·计算机视觉·matlab
丕羽7 小时前
【Pytorch】基本语法
人工智能·pytorch·python