PyTorch中torch.flatten()函数的用法

算法与编程之美2025-12-28 11:19

1 问题

在编写神经网络数据从输入层前向传播到输出层的函数时，使用了torch.flatten()函数，但是torch.flatten()函数的各个参数的含义是什么以及怎么用呢？

2 方法

flatten翻译成中文是扁平化，使......平坦，即把多维的输入拉伸一维化，右键单击flatten转到定义后发现torch.flatten()方法一共有三个参数：

1.input：tensor，需要被拉伸展平的输入；

2.start_dim：开始拉伸展平的维度，默认为0；

3.end_dim：结束拉伸展平的维度，默认为-1。

通过实例实验后，了解了参数的具体用法，首先，利用torch.rand()函数随机产生一个四维数据实验后得知：

1.torch.flatten(x)就等于torch.flatten(x,0)，默认将输入拉伸为一维的向量,从第一维开始扁平化；

2.torch.flatten(x,1)表示从第二维开始扁平化；

3.torch.flatten(x,0,1)表示在第一维和第二维之间扁平化。

运行结果如下：

其次，定义了一个三维数据实验后得知：

1.start_dim为1，end_dim默认为-1时，第一维度不变；

2.start_dim为0，并且锁定结束维度为1时，前面的维度就会合并。

****运行结果如下：

3 结语

针对torch.flatten()函数各个参数的含义是什么以及如何使用的问题，查看了函数本身的定义并搜索了函数参数的其他解释，通过随机产生一个四维数据和假设一个三维数据实例实验后，了解了利用torch.flatten()函数设置不同参数的具体用法，本文只描述了torch.flatten()函数，未来还可以更深入了解torch.nn.Flatten()函数、torch.Tensor.flatten()函数以及它们的区别等。