1. expand -- 不复制数据的广播式扩展
规则 :只能将
size=1的维度扩展为更大。内存 :返回视图(与原张量共享数据),高效。
语法 :
tensor.expand(*target_shape)
import torch
x = torch.tensor([[1], [2], [3]]) # (3, 1)
y = x.expand(3, 4) # (3, 4) 把第二维从1扩展到4
# y: [[1,1,1,1], [2,2,2,2], [3,3,3,3]]
# 支持 -1 表示保持该维度大小
z = x.expand(3, -1) # (3, 1) 保持不变
注意:通过将目标形状对应位置设为 1 或使用 unsqueeze 配合
# 想要与形状为 (batch, 3, H, W) 的输入广播,但 weight 没有 batch 维度
weight_expanded = weight.unsqueeze(0).expand(8, -1, -1, -1, -1)
# shape: (8, 64, 3, 5, 5) ,其中 -1 表示保持原大小
2. repeat -- 实际复制数据的重复平铺
规则:将张量在每个维度上重复指定次数(次数是整数)。
内存 :分配新内存,独立于原张量。
语法 :
tensor.repeat(*repeats)-- 重复次数列表。
x = torch.tensor([[1, 2], [3, 4]]) # (2, 2)
y = x.repeat(2, 3) # (4, 6) 第0维重复2次,第1维重复3次
# y:
# [[1,2,1,2,1,2],
# [3,4,3,4,3,4],
# [1,2,1,2,1,2],
# [3,4,3,4,3,4]]
关键区别速记表
| 函数 | 限制 | 内存 | 典型场景 |
|---|---|---|---|
| expand | 只能扩展 size=1 的维度 | 共享 | 偏置加法、广播对齐 |
| repeat | 可重复任意维度 | 复制 | 需要独立副本、平铺图案 |
只想逻辑上"变大"用
expand(省内存)。需要真正复制数据用
repeat(独立存储)。