pytorch中的维度变换操作性质大总结:view, reshape, transpose, permute

在深度学习中,张量的维度变换是很重要的操作。在pytorch中,有四个用于维度变换的函数,view, reshape, transpose, permute。其中view, reshape都用于改变张量的形状,transpose, permute都用于重新排列张量的维度,但它们的功能和使用场景有所不同,下面将进行详细介绍,并给出测试验证代码,经过全面的了解,我们才能知道如何正确的使用这四个函数。

这里写目录标题

    • [1. torch.Tensor.view](#1. torch.Tensor.view)
    • [2. torch.reshape](#2. torch.reshape)
    • [3. torch.transpose](#3. torch.transpose)
    • [4. torch.permute](#4. torch.permute)
    • [5. torch.transpose与torch.permute的性质与原理](#5. torch.transpose与torch.permute的性质与原理)

1. torch.Tensor.view

文档:Doc

  • view 方法返回一个新的张量,具有与原始张量相同的数据,但改变了形状。所以view返回的是原始数据的一个新尺寸的视图,这也就是为什么叫做view。

    python 复制代码
    import torch
    # 创建一个2x6的张量
    x = torch.tensor([[1, 2, 3, 4, 5, 6],
                      [7, 8, 9, 10, 11, 12]])
    # 将其调整为3x4的形状
    y = x.view(3, 4)
    print("x shape: ", x.shape)
    print("y shape: ", y.shape)
    # 判断新旧张量是否数据是相同的
    print(x.data_ptr() == y.data_ptr())

    输出:

    shell 复制代码
    x shape:  torch.Size([2, 6])
    y shape:  torch.Size([3, 4])
    True
  • view 要求原始张量是连续的(即在内存中是按顺序存储的),否则会抛出错误。

    python 复制代码
    import torch
    # 创建一个2x6的张量
    x = torch.tensor([[1, 2, 3, 4, 5, 6],
                      [7, 8, 9, 10, 11, 12]])
    # 将向量转置,此时x不再是连续的
    x = x.T
    # 在不连续的张量上进行view将会报错
    y = x.view(3, 4)

    报错输出:

    python 复制代码
    RuntimeError: view size is not compatible with input tensor's size and stride (at least one dimension spans across two contiguous subspaces). Use .reshape(...) instead.
  • 如果张量不是连续的,可以使用 contiguous 方法先将其转换为连续的。

2. torch.reshape

文档:Doc

  • reshape不要求原始张量是连续的

  • 如果原始张量是连续的,那么实现的功能和view一样

  • 如果原始张量不是连续的,那么reshape就是tensor.contigous().view(),也就是会重新开辟一块内存空间,拷贝原始张量,使其连续;

  • 在连续张量上,view 和 reshape 性能相同。在非连续张量上,reshape 可能会稍慢一些,因为它可能需要创建新的连续张量。

    python 复制代码
    import torch
    # 创建一个2x6的张量
    x = torch.tensor([[1, 2, 3, 4, 5, 6],
                      [7, 8, 9, 10, 11, 12]])
    # 将向量转置,此时x不再是连续的
    x = x.T
    # 在不连续的张量上可以进行reshape
    y = x.reshape(3, 4)
    print("x shape: ", x.shape)
    print("y shape: ", y.shape)
    # 但reshape返回的是新的内存中的张量
    print(x.data_ptr() == y.data_ptr())

    输出:

    shell 复制代码
    x shape:  torch.Size([6, 2])
    y shape:  torch.Size([3, 4])
    False

3. torch.transpose

Doc

  • 功能:仅用于交换两个维度。它接受两个维度参数,分别表示要交换的维度。

  • 不改变数据:不会改变数据本身,只是改变数据的视图(即不复制数据)。

  • 生成的新张量也通常不是连续的。它只是交换两个维度的顺序,不改变数据在内存中的实际存储顺序。

  • 对原始张量是不是连续的没有要求

    python 复制代码
    import torch
    # 创建一个3x4的张量
    x = torch.tensor([[1, 2, 3, 4],
                        [5, 6, 7, 8],
                        [9, 10, 11, 12]])
    print(x.is_contiguous())
    # 交换第一个和第二个维度
    y = torch.transpose(x, 0, 1)
    print(y.is_contiguous())
    print("x shape: ", x.shape)
    print("y shape: ", y.shape)
    print(x.data_ptr() == y.data_ptr())

    输出:

    shell 复制代码
    True
    False
    x shape:  torch.Size([3, 4])
    y shape:  torch.Size([4, 3])
    True

4. torch.permute

Doc

  • 可以重新排列任意数量的维度,适用于复杂的维度变换。接受一个shape元组作为参数

  • 不改变数据:不会改变数据本身,只是改变数据的视图(即不复制数据)

  • 生成的新张量通常不是连续的。因为它仅改变维度顺序,不改变数据在内存中的实际顺序。

  • 对原始张量是不是连续的没有要求

    python 复制代码
    	import torch
    	# 创建一个3x4x5的张量
    	x = torch.randn(3, 4, 5)
    	
    	# 将其第一个和第二个维度交换
    	y = torch.permute(x, (1, 0, 2))
    	print(y.is_contiguous())
    	print(x.data_ptr() == y.data_ptr())
    	print(y.size())  # 输出:torch.Size([4, 3, 5])

    输出:

    shell 复制代码
    False
    True
    torch.Size([4, 3, 5])

5. torch.transpose与torch.permute的性质与原理

这两者的功能和各方面的性质基本是相同的,只是一个只能交换两个维度,一个能进行更复杂的维度排列。他们的原理是:transpose 和 permute 通过改变张量的 strides(步幅)来重新排列维度。strides 定义了在内存中沿着每个维度移动的步长。它们不改变张量的数据,只是改变了访问数据的方式。因此,这些操作可以应用于任何张量,无论它们是否连续。

相关推荐
一RTOS一9 分钟前
工业AI安监超脑,为智能建造打造“安全数字底座”
人工智能·安全
云安全联盟大中华区12 分钟前
构建AI原生工程组织:关于速度、文化与安全的经验
人工智能·安全·web安全·网络安全·ai·ai-native
nju_spy19 分钟前
论文阅读 - 深度学习端到端解决库存管理问题 - 有限时间范围内的多周期补货问题(Management Science)
人工智能·深度学习·动态规划·端到端·库存管理·两阶段pto·多周期补货问题
u***j32419 分钟前
深度学习实践
人工智能·深度学习
r***d86522 分钟前
深度学习挑战
人工智能·深度学习
新加坡内哥谈技术26 分钟前
迈向星际 QUIC 流量
人工智能
用户120391129472627 分钟前
打破信息壁垒:手把手教你实现DeepSeek大模型的天气查询功能
python·openai
受之以蒙31 分钟前
具身智能的“任督二脉”:用 Rust ndarray 打通数据闭环的最后一公里
人工智能·笔记·rust
强盛小灵通专卖员35 分钟前
Airsim仿真、无人机、Lidar深度相机、DDPG深度强化学习
人工智能·无人机·sci·研究生·ei会议·中文核心期刊·小论文
小oo呆38 分钟前
【自然语言处理与大模型】BERTopic主题建模
人工智能·自然语言处理