Pytorch--tensor.view()

在 PyTorch 中,tensor.view() 是一个常用的方法,用于改变张量(Tensor)的形状(shape),但不会改变其数据本身。它类似于 NumPy 的 reshape(),但有一些关键区别。


1. 基本用法

python 复制代码
import torch

x = torch.arange(1, 10)  # shape: [9]
print(x)
# tensor([1, 2, 3, 4, 5, 6, 7, 8, 9])

# 改变形状为 (3, 3)
y = x.view(3, 3)  
print(y)
# tensor([[1, 2, 3],
#         [4, 5, 6],
#         [7, 8, 9]])

关键点

  • 不改变数据,只是重新排列维度。

  • 新形状的元素数量必须与原张量一致 ,否则会报错:

    python 复制代码
    x.view(2, 5)  # ❌ 错误!因为 2×5=10,但 x 只有 9 个元素

2. 自动推断维度(-1 的作用)

如果不想手动计算某个维度的大小,可以用 -1,PyTorch 会自动计算:

python 复制代码
x = torch.arange(1, 10)  # shape: [9]

# 自动计算行数,确保列数是 3
y = x.view(-1, 3)  # shape: [3, 3]
print(y)
# tensor([[1, 2, 3],
#         [4, 5, 6],
#         [7, 8, 9]])

# 自动计算列数,确保行数是 3
z = x.view(3, -1)  # shape: [3, 3]
print(z)
# 输出同上

3. view() vs reshape()

方法 是否共享内存 是否适用于非连续存储 适用场景
view() ✅ 共享内存(修改会影响原张量) ❌ 仅适用于连续存储的张量 高效改变形状(推荐优先使用)
reshape() ✅ 可能共享内存(如果可能) ✅ 适用于非连续存储 更通用,但可能额外复制数据

示例对比

python 复制代码
x = torch.arange(1, 10)  # 连续存储

# view() 可以正常工作
y = x.view(3, 3)  

# 如果张量不连续(如转置后),view() 会报错
x_transposed = x.t()  # 转置后存储不连续
# z = x_transposed.view(9)  # ❌ RuntimeError: view size is not compatible with input tensor's size and stride

# reshape() 可以处理非连续存储
z = x_transposed.reshape(9)  # ✅

4. 常见用途

(1) 展平张量(Flatten)

python 复制代码
x = torch.randn(4, 5)  # shape: [4, 5]
flattened = x.view(-1)  # shape: [20]

(2) 调整 CNN 特征图维度

python 复制代码
# 假设 CNN 输出是 [batch_size, channels, height, width]
features = torch.randn(32, 64, 7, 7)  # shape: [32, 64, 7, 7]

# 展平成 [batch_size, channels * height * width] 用于全连接层
flattened = features.view(32, -1)  # shape: [32, 64*7*7] = [32, 3136]

(3) 交换维度(类似 permute

python 复制代码
x = torch.randn(2, 3, 4)  # shape: [2, 3, 4]
y = x.view(2, 4, 3)  # shape: [2, 4, 3](相当于交换最后两维)

5. 注意事项

  1. view() 只适用于连续存储的张量 ,否则会报错,此时应该用 reshape() 或先 .contiguous()

    python 复制代码
    x_non_contiguous = x.t()  # 转置后不连续
    x_contiguous = x_non_contiguous.contiguous()  # 变成连续存储
    y = x_contiguous.view(...)  # 现在可以用 view()
  2. view() 返回的新张量与原张量共享内存 ,修改其中一个会影响另一个:

    python 复制代码
    x = torch.arange(1, 10)
    y = x.view(3, 3)
    y[0, 0] = 100  # 修改 y 会影响 x
    print(x)  # tensor([100, 2, 3, 4, 5, 6, 7, 8, 9])

总结

操作 推荐方法
改变形状(连续张量) view()
改变形状(非连续张量) reshape().contiguous().view()
展平张量 x.view(-1)torch.flatten(x)
调整 CNN 特征图维度 features.view(batch_size, -1)

view() 是 PyTorch 中高效调整张量形状的首选方法,但要注意内存共享和连续性限制! 🚀
展平(Flatten)或改变形状(如 viewreshape)的核心原则是保持张量的总元素个数(numel())不变,只是重新排列这些元素的维度。


1. 元素总数不变原则

无论原始张量是几维的(1D、2D、3D 或更高维),转换后的新形状必须满足:
原形状的元素总数 = 新形状的元素总数 \text{原形状的元素总数} = \text{新形状的元素总数} 原形状的元素总数=新形状的元素总数

即:

元素总数需满足:
dim 1 × dim 2 × ⋯ × dim n = new_dim 1 × new_dim 2 × ⋯ × new_dim m \text{dim}_1 \times \text{dim}_2 \times \dots \times \text{dim}_n = \text{new\_dim}_1 \times \text{new\_dim}_2 \times \dots \times \text{new\_dim}_m dim1×dim2×⋯×dimn=new_dim1×new_dim2×⋯×new_dimm

示例:
python 复制代码
import torch

x = torch.arange(24)  # 1D 张量,24 个元素
print(x.numel())      # 输出:24

# 转换为 2D 张量:4 行 × 6 列(4×6=24)
y = x.view(4, 6)      # 形状 [4, 6]

# 转换为 3D 张量:2×3×4(2×3×4=24)
z = x.view(2, 3, 4)   # 形状 [2, 3, 4]

2. 自动推断维度(-1 的作用)

在指定新形状时,可以用 -1 代表"自动计算该维度大小" ,PyTorch 会根据总元素数和其他已知维度推导出 -1 的值。

规则:
推断的维度 = 总元素数 已知维度的乘积 \text{推断的维度} = \frac{\text{总元素数}}{\text{已知维度的乘积}} 推断的维度=已知维度的乘积总元素数

示例:
python 复制代码
x = torch.arange(24)  # 24 个元素

# 自动计算行数,确保列数为 6
y = x.view(-1, 6)     # 形状 [4, 6](因为 24/6=4)

# 自动计算列数,确保行数为 3
z = x.view(3, -1)     # 形状 [3, 8](因为 24/3=8)
错误示例:

如果维度乘积不匹配总元素数,会报错:

python 复制代码
x.view(5, -1)  # ❌ 报错!24 无法被 5 整除

3. 展平(Flatten)的本质

展平是将任意维度的张量转换为一维或二维的形式:

  • 一维展平x.view(-1)x.flatten()
    将所有元素排成一行,形状变为 [num_elements]
  • 二维展平(保留批处理维度)x.view(batch_size, -1)nn.Flatten()
    保持 batch_size 不变,其余维度合并为第二维,形状变为 [batch_size, features]
示例:
python 复制代码
x = torch.randn(2, 3, 4)  # 形状 [2, 3, 4],总元素数=24

# 一维展平
flatten_1d = x.view(-1)    # 形状 [24]

# 二维展平(保留第0维 batch_size=2)
flatten_2d = x.view(2, -1) # 形状 [2, 12](因为 3×4=12)

4. 为什么需要手动指定部分维度?

  • 全连接层的输入要求
    通常需要二维张量 [batch_size, features],因此需明确保留 batch_size,其余维度展平。
  • 避免歧义
    例如,若张量形状为 [32, 64, 7, 7],想展平成 [32, 3136],需明确第二维是 3136(即 64×7×7),而 -1 让 PyTorch 自动计算。
代码对比:
python 复制代码
# 明确指定第二维
flatten_explicit = x.view(32, 64*7*7)  # 形状 [32, 3136]

# 用 -1 自动计算
flatten_auto = x.view(32, -1)          # 形状 [32, 3136](推荐)

5. 关键总结

  1. 元素总数不变:形状变换的本质是重新排列数据,不增删元素。
  2. -1 的作用:自动计算该维度大小,确保总元素数匹配。
  3. 展平的应用场景
    • 全连接层前必须将多维特征转换为一维向量(如 CNN 的 [batch, C, H, W][batch, C*H*W])。
    • 数据预处理时调整输入形状(如图像展平为向量)。
相关推荐
星际码仔2 小时前
AutoGLM沉思,仍然没有摆脱DeepResearch产品的通病
人工智能·ai编程·chatglm (智谱)
喝拿铁写前端2 小时前
前端与 AI 结合的 10 个可能路径图谱
前端·人工智能
城电科技3 小时前
城电科技|零碳园区光伏太阳花绽放零碳绿色未来
人工智能·科技·能源
HyperAI超神经3 小时前
Stable Virtual Camera 重新定义3D内容生成,解锁图像新维度;BatteryLife助力更精准预测电池寿命
图像处理·人工智能·3d·数学推理·视频生成·对话语音生成·蛋白质突变
Chaos_Wang_3 小时前
NLP高频面试题(二十三)对抗训练的发展脉络,原理,演化路径
人工智能·自然语言处理
Yeats_Liao3 小时前
华为开源自研AI框架昇思MindSpore应用案例:基于MindSpore框架实现PWCNet光流估计
人工智能·华为
说私域4 小时前
人工智能赋能美妆零售数字化转型:基于开源AI大模型的S2B2C商城系统构建
人工智能·小程序·开源·零售
zew10409945884 小时前
基于深度学习的手势识别系统设计
人工智能·深度学习·算法·数据集·pyqt·yolov5·训练模型
weixin_478689764 小时前
pytorch与其他ai工具
人工智能·pytorch·python
豆芽8194 小时前
核函数(机器学习深度学习)
人工智能·深度学习