【笔记】unsqueeze

unsqueeze是 PyTorch 中的一个方法,用于在指定位置插入一个维度为 1 的新维度。这个操作对于调整张量的形状非常有用,尤其是在需要匹配特定维度要求(例如模型输入或 `torchvision.utils.make_grid` 函数的要求)时。

理解 unsqueeze

假设你有一个形状为 [2, 3] 的二维张量:

python 复制代码
tensor = torch.randn(2, 3)
print(tensor.shape)  # 输出: torch.Size([2, 3])

如果你想要把这个张量变成三维的,比如形状变为 [1, 2, 3],就可以使用 unsqueeze方法。你可以指定在哪一个维度上增加新的维度(从0开始计数)。

  • 在第0维增加新维度:tensor.unsqueeze(0)

  • 在第1维增加新维度:tensor.unsqueeze(1)

例如:

python 复制代码
# 在第0维增加新维度
new_tensor_0 = tensor.unsqueeze(0)
print(new_tensor_0.shape)  # 输出: torch.Size([1, 2, 3])

# 在第1维增加新维度
new_tensor_1 = tensor.unsqueeze(1)
print(new_tensor_1.shape)  # 输出: torch.Size([2, 1, 3])

应用场景

在我的代码上下文中,unsqueeze主要用于确保传入 `make_grid` 的张量具有正确的维度make_grid 需要输入是一个四维张量 (B, C, H, W),其中:

  • B表示批量大小(Batch Size)

  • C表示通道数(Channels)

  • H表示高度(Height)

  • W表示宽度(Width)

例如,如果有一个形状为 [7, 224, 224]的 mask 张量(即它只有三个维度),而你需要将其转换为四个维度的形式以满足 make_grid 的要求,你可以使用 unsqueeze(1)来在第二个维度(通道维度)上增加一个新的维度:

python 复制代码
masks = masks.unsqueeze(1)  # 将 [7, 224, 224] 转换为 [7, 1, 224, 224]

这样,mask 的形状就变成了 [7, 1, 224, 224],符合 make_grid的输入要求。

相关推荐
中屹指纹浏览器1 小时前
中屹指纹浏览器的IP-指纹协同适配技术架构与实现原理
经验分享·笔记
崎岖Qiu1 小时前
【OS笔记40】:设备管理 - 通道控制方式
笔记·操作系统·dma·os
自不量力的A同学2 小时前
Midjourney 推出面向动漫领域的图像生成模型:Niji V7
笔记
狐572 小时前
2026-01-12-云计算速成课-期末复习
笔记·云计算·期末复习
saoys2 小时前
Opencv 学习笔记:形态学开 / 闭运算(解决噪点与孔洞问题)
笔记·opencv·学习
深蓝海拓2 小时前
PySide6,QEventLoop.exec()的使用
笔记·python·qt·学习·pyqt
hetao17338372 小时前
2026-01-09~12 hetao1733837 的刷题笔记
c++·笔记·算法
代码游侠3 小时前
学习笔记——嵌入式系统与51单片机核心
笔记·单片机·嵌入式硬件·学习·51单片机
今儿敲了吗3 小时前
计算机网络第三章笔记(四)
笔记·计算机网络
狐573 小时前
2026-01-12-LeetCode刷题笔记-1266-访问所有点的最小时间.md
笔记·算法·leetcode