torch:expand和repeate的区别

月疯2026-06-11 14:17

1. `expand` -- 不复制数据的广播式扩展

规则：只能将 size=1 的维度扩展为更大。

内存：返回视图（与原张量共享数据），高效。

语法：tensor.expand(*target_shape)

复制代码

import torch

x = torch.tensor([[1], [2], [3]])   # (3, 1)
y = x.expand(3, 4)                  # (3, 4) 把第二维从1扩展到4
# y: [[1,1,1,1], [2,2,2,2], [3,3,3,3]]

# 支持 -1 表示保持该维度大小
z = x.expand(3, -1)                 # (3, 1) 保持不变

注意：通过将目标形状对应位置设为 1 或使用 unsqueeze 配合

复制代码

# 想要与形状为 (batch, 3, H, W) 的输入广播，但 weight 没有 batch 维度
weight_expanded = weight.unsqueeze(0).expand(8, -1, -1, -1, -1)  
# shape: (8, 64, 3, 5, 5) ，其中 -1 表示保持原大小

2. `repeat` -- 实际复制数据的重复平铺

规则：将张量在每个维度上重复指定次数（次数是整数）。

内存：分配新内存，独立于原张量。

语法：tensor.repeat(*repeats) -- 重复次数列表。

复制代码

x = torch.tensor([[1, 2], [3, 4]])   # (2, 2)
y = x.repeat(2, 3)                   # (4, 6) 第0维重复2次，第1维重复3次
# y:
# [[1,2,1,2,1,2],
#  [3,4,3,4,3,4],
#  [1,2,1,2,1,2],
#  [3,4,3,4,3,4]]

关键区别速记表

函数	限制	内存	典型场景
expand	只能扩展 size=1 的维度	共享	偏置加法、广播对齐
repeat	可重复任意维度	复制	需要独立副本、平铺图案

只想逻辑上"变大"用 expand（省内存）。

需要真正复制数据用 repeat（独立存储）。

torch:expand和repeate的区别

1. expand -- 不复制数据的广播式扩展

2. repeat -- 实际复制数据的重复平铺

关键区别速记表

1. `expand` -- 不复制数据的广播式扩展

2. `repeat` -- 实际复制数据的重复平铺