1 问题
在编写神经网络数据从输入层前向传播到输出层的函数时,使用了torch.flatten()函数,但是torch.flatten()函数的各个参数的含义是什么以及怎么用呢?
2 方法
flatten翻译成中文是扁平化,使......平坦,即把多维的输入拉伸一维化,右键单击flatten转到定义后发现torch.flatten()方法一共有三个参数:
1.input:tensor,需要被拉伸展平的输入;
2.start_dim:开始拉伸展平的维度,默认为0;
3.end_dim:结束拉伸展平的维度,默认为-1。
通过实例实验后,了解了参数的具体用法,首先,利用torch.rand()函数随机产生一个四维数据实验后得知:
1.torch.flatten(x)就等于torch.flatten(x,0),默认将输入拉伸为一维的向量,从第一维开始扁平化;
2.torch.flatten(x,1)表示从第二维开始扁平化;
3.torch.flatten(x,0,1)表示在第一维和第二维之间扁平化。
运行结果如下:
其次,定义了一个三维数据实验后得知:
1.start_dim为1,end_dim默认为-1时,第一维度不变;
2.start_dim为0,并且锁定结束维度为1时,前面的维度就会合并。
**
**运行结果如下:
3 结语
针对torch.flatten()函数各个参数的含义是什么以及如何使用的问题,查看了函数本身的定义并搜索了函数参数的其他解释,通过随机产生一个四维数据和假设一个三维数据实例实验后,了解了利用torch.flatten()函数设置不同参数的具体用法,本文只描述了torch.flatten()函数,未来还可以更深入了解torch.nn.Flatten()函数、torch.Tensor.flatten()函数以及它们的区别等。