【分享】Pytorch数据结构：Tensor（张量）及其维度和数据类型

在PyTorch中，Tensor（张量）是一个多维数组，可以用于存储和操作数据。它类似于Numpy数组，但具有GPU加速和自动求导等功能。

张量有不同的维度，可以是0维（标量）、1维（向量）、2维（矩阵）或更高维。例如，一个0维张量被称为标量，它有一个元素。一个1维张量被称为向量，它有一个轴和多个元素。一个2维张量被称为矩阵，它有两个轴（行和列）和多个元素。以此类推，一个更高维的张量有多个轴和多个元素。

每个张量都有一个数据类型，例如浮点型（float）、整型（int）、布尔型（bool）等。在PyTorch中，常用的数据类型有torch.float32，torch.float64，torch.int32，torch.int64等。

Tensor基础

Tensor（张量）是PyTorch中用于表示多维数据的主要数据结构，类似于多维数组，可以存储和操作数字数据。

1.1、Tensor的维度（Dimensions）

Tensor的维度可以理解为Tensor包含的数据在不同方向上的层次或级别。在数学和计算机科学中，维度通常用来描述数据结构的复杂性或者数据在空间中的方向。对于Tensor来说，每一个维度都代表了数据的一个特定的方向或特性。

Tensor（张量）的维度（Dimensions）是指张量的轴数或阶数。可以类似用坐标轴来理解，可以类比的用坐标轴理解，即Tensor有多少个方向。比如1维，x轴只有一个方向；2维，x轴y轴，两个方向，x轴固定长度；3维，x轴y轴z轴，三个方向，x轴和y轴固定长度。

基本的tensor创建方法：

java 复制代码

import torch
x=torch.tensor(data)#利用data创建tensor，data可以是各总维度的列表，或一个常数

下面就让我们来举例说明

0维Tensor：也就是一个标量（Scalar），它没有维度，仅仅是一个单一的数值。例如，温度值、价格或者某个计数。

举例说明：torch.tensor(1)、 torch.tensor(2)

**1维Tensor：**也称作向量（Vector），它有一个维度，可以看作是一系列数值的集合。例如，一维数组 $1, 2, 3$ 代表一系列数值或某个特性的不同测量值。当我们将一维张量称为向量时，那么 tensor( $1,2,3$ )是一个3维向量，一个一维张量。

举例说明：torch.tensor( $1,2,3,4,5$ )、torch.tensor( $15,2,3,4,5,51$ )

**2维Tensor：**也称作矩阵（Matrix），它有两个维度，可以表示为行和列。例如，在表格数据中，行可能代表不同的样本，列代表不同的特征或观察值。注意，由于列代表了不同的特征，因此每一行的元素数必须相同，每一行是一个一维的。相当于多个一维构成一个二维。

举例说明：torch.tensor( $\[1,2,5$ , $3,4,2$ ])，暂且可以理解为这里有两行分别为 $1,2,5$ 和 $3,4,2$ ，这是一个2×3的矩阵。

**3维Tensor：**可以想象为一个数据立方体，常用于表示时间序列数据、图像数据等。例如，在处理图像时，一个3维Tensor可能有三个维度：高度、宽度和颜色通道。相当于多个二维构成一个三维，每个二维的性状必须相同。

举例说明：torch.tensor( $\[\[1,2$ , $3,4$ ] , $\[3,3$ $2,2$ ] ])，一个三维中，有两个二维，这是一个2×2×2的三维Tensor。

接下来是高维Tensor

随着维度的增加，Tensor可以表示更加复杂的数据结构。例如，在深度学习中，经常会处理4维Tensor来表示一批图像数据，其中维度分别代表样本数、高度、宽度和颜色通道。在自然语言处理（NLP）任务中，可能会使用3维或更高维度的Tensor来表示句子、单词和特征向量。

dim()和.size()方法

在PyTorch中，.dim()和.size()方法用于获取Tensor的维度信息，但它们提供了不同类型的信息：

dim()方法

.dim()方法返回Tensor的维度数，即Tensor有多少轴。（类似多少个坐标轴）

对于一个给定的Tensor，.dim()告诉你这个Tensor是几维的。

例如，如果你有一个2D Tensor（比如一个矩阵），.dim()将返回2；如果是一个3D Tensor（比如一个时间序列数据集），.dim()将返回3。

size()方法

.size()方法返回一个Tensor每个维度的大小（长度），以torch.Size类型表示，其实质是一个元组。（类似告诉你每一个坐标轴的长度，不过是按照z,y,x的方式给出的。z个矩形，y行，x列，更高维以此类推）

它提供了关于Tensor每个轴的具体大小的详细信息。如果你想知道一个Tensor的形状，比如有多少行和列，你会使用.size()。

.size()可以返回全部维度的大小，也可以通过指定维度的索引来返回特定维度的大小。例如，对于一个形状为(3, 4, 5)的3D Tensor，.size()将返回torch.Size( $3, 4, 5$ )，而.size(1)将仅返回第二维（即4行）的大小，这和.size(-2)等价。

还有shape属性

.shape属性和直接调用.size()返回的是一样的。

最有torch.randn()

torch.randn()可以生成一个指定维度的随机数据的张量。

java 复制代码

import torch
tensor=torch.randn(3,3,4,5)
print(tensor.size())

输出：torch.Size( $3, 3, 4, 5$ )

创建一个张量的方式非常简单，可以使用torch.tensor()函数，并传递数据和数据类型作为参数。以下是一个示例：

python 复制代码

import torch

# 创建一个标量张量
scalar_tensor = torch.tensor(3.14, dtype=torch.float32)
print(scalar_tensor)

# 创建一个向量张量
vector_tensor = torch.tensor([1, 2, 3, 4, 5], dtype=torch.int32)
print(vector_tensor)

# 创建一个矩阵张量
matrix_tensor = torch.tensor([[1, 2, 3], [4, 5, 6]], dtype=torch.float64)
print(matrix_tensor)

输出：

复制代码

tensor(3.1400)
tensor([1, 2, 3, 4, 5], dtype=torch.int32)
tensor([[1., 2., 3.],
        [4., 5., 6.]], dtype=torch.float64)

除了使用torch.tensor()函数创建张量，还可以使用其他函数如torch.zeros()、torch.ones()、torch.randn()等创建具有特定形状和数据类型的张量。