转置卷积(Transposed Convolution)的简单理解运用

转置卷积(也叫反卷积、上采样卷积)是卷积神经网络中常用的操作,尤其在生成模型(如生成对抗网络、U-Net)中用于增加特征图的空间维度。

简单地说,转置卷积是通过插值和卷积操作将较小的输入张量"放大",生成一个更大的输出张量。

输出尺寸计算公式:

  • H_inW_in 是输入特征图的高和宽。
  • K_hK_w 是卷积核的高和宽。
  • S 是步幅。
  • P 是填充。
  • O_p 是输出填充。

|-------|--------------------------|----------------------------|
| 特性 | 转置卷积 (ConvTranspose2d) | Upsample / interpolate |
| 方法类型 | 学习型方法,通过训练卷积核 | 非学习型方法,基于插值规则 |
| 实现原理 | 插值 + 卷积 | 仅插值,常见插值方法包括最近邻、双线性等 |
| 训练过程 | 卷积核是可训练的,网络通过学习来优化上采样的效果 | 不涉及训练,插值固定 |
| 输出的质量 | 生成更自然、更细致的上采样图像,适合生成任务 | 输出图像质量与插值方法有关,可能没有转置卷积细致 |
| 计算速度 | 较慢,涉及卷积操作和反向传播 | 非常快,直接通过插值进行上采样 |
| 应用场景 | GAN、U-Net、图像生成等生成任务 | 图像放大、简单的上采样任务 |

实例:

python 复制代码
import torch
import torch.nn as nn

# 转置卷积层,包含额外的输出填充
conv_transpose = nn.ConvTranspose2d(in_channels=1, out_channels=1, kernel_size=3, stride=2, padding=1, output_padding=1)

# 输入图像:1x1x4x4
input_tensor = torch.tensor([[[[1.0, 2.0, 3.0, 4.0],
                              [5.0, 6.0, 7.0, 8.0],
                              [9.0, 10.0, 11.0, 12.0],
                              [13.0, 14.0, 15.0, 16.0]]]], dtype=torch.float32)

# 应用转置卷积
output_tensor = conv_transpose(input_tensor)

# 输出张量的形状
print(f"Input shape: {input_tensor.shape}")
print(f"Output shape after ConvTranspose2d: {output_tensor.shape}")

输出:

Input shape: torch.Size([1, 1, 4, 4])

Output shape after ConvTranspose2d: torch.Size([1, 1, 8, 8])

深入理解原理:转置卷积(Transposed Convolution)-CSDN博客

视频讲解:

相关推荐
寻道码路19 分钟前
LangChain4j Java AI 应用开发实战(四):提示词工程进阶 - 模板化与结构化 Prompt 设计
java·人工智能·ai·prompt·aigc
Raink老师6 小时前
【AI面试临阵磨枪-70】Agent 系统如何做分布式调度、跨服务协作、故障恢复?
人工智能·面试·职场和发展
tedcloud1236 小时前
RTK部署教程:构建稳定的AI Workflow环境
服务器·javascript·人工智能·typescript·ocr
Raink老师6 小时前
【AI面试临阵磨枪-71】如何用 AI 优化推荐系统、内容审核、广告创意、搜索体验?
人工智能·面试·职场和发展
AI医影跨模态组学6 小时前
Biomarker Res(IF=11.5)安徽医科大学第一医院:基于机器学习的放射组学模型:子宫内膜癌患者的预后预测及机制探索
人工智能·深度学习·论文·医学·医学影像·影像组学
ftpeak6 小时前
Mooncake:以 KVCache 为中心的分离式 LLM 服务架构
人工智能·ai·架构·ai编程·ai开发
lqqjuly6 小时前
Transformer架构详解 - 第一、二部分:基础与核心思想、核心组件详解
深度学习·神经网络·自然语言处理
Terrence Shen6 小时前
Hermes agent的tools是怎么落地应用的系列
人工智能·llm·agent·hermes
Raink老师6 小时前
【AI面试临阵磨枪-72】电商全场景 AI Agent 设计(商品咨询 / 订单 / 物流 / 售后 / 退款)
人工智能·面试·职场和发展
仙女修炼史6 小时前
CNN更看重Texture还是shape:imagenet-trained cnns are biased
论文阅读·人工智能·cnn