Pytorch：torchvision.transforms.Compose

北方骑马的萝卜2024-03-28 20:00

transforms.Compose 是PyTorch库中torchvision.transforms 模块提供的一个功能，它允许将多个图像变换操作组合起来 。当你在处理图像，并需要依次应用多个变换（如缩放、裁剪、归一化等）时，Compose可以把这些变换串联成一个单一的操作，这样你就可以非常方便地在数据集上应用这个组合操作。

使用Compose的时候，通常是在定义数据加载时进行。以下是一个例子：

python 复制代码

from torchvision import transforms

# 定义一系列图像变换操作
transformations = transforms.Compose([
    transforms.Resize(256),            # 缩放图像，使得短边为256像素
    transforms.CenterCrop(224),        # 从中心裁剪224x224的图像
    transforms.ToTensor(),             # 将PIL图像或NumPy ndarray转换为FloatTensor，并归一化至[0.0, 1.0]
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # 对图像进行标准化处理
])

# 然后你可以将这些组合的变换应用到数据集上
from torchvision.datasets import ImageFolder
dataset = ImageFolder(root='path_to_dataset', transform=transformations)

在上述代码中，transforms.Compose 用来将四个图像预处理步骤串联起来：

transforms.Resize(256)：调整图像大小。
transforms.CenterCrop(224)：从图像中心裁剪出一个224x224大小的区域。
transforms.ToTensor()：将图像转换为PyTorch的Tensor。
transforms.Normalize：标准化图像数据。

这样，当你从dataset中取数据时，每个获取的图像项目都会自动通过这个组合的变换流程处理。这是机器学习和深度学习实验中进行数据预处理的一种常见方式。