用的不是很多,了解基础的就行了。
python
transforms_train = torchvision.transforms.Compose([
torchvision.transforms.ToPILImage(),
# imagenet mean and std
torchvision.transforms.RandomHorizontalFlip(p=0.5), # 翻转概率的p=0.5
torchvision.transforms.RandomAffine(degrees=10, shear=16), # 对图像进行随机仿射变换,包括旋转、平移、缩放和剪切等。
torchvision.transforms.ColorJitter(brightness=0.1, contrast=0.1, saturation=0.1, hue=0.1),
# 对图像进行颜色抖动,包括亮度、对比度、饱和度和色调等方面的随机变化。
# torchvision.transforms.RandomGrayscale(p=0.1),
# not in the original paper
torchvision.transforms.Resize((256, 256)),
torchvision.transforms.RandomCrop((227, 227)), # VGG16
torchvision.transforms.ToTensor(),
# torchvision.transforms.Normalize([0.4816, 0.4199, 0.3884], [0.2568, 0.2408, 0.2323]),
torchvision.transforms.Normalize([0.485, 0.456, 0.406],
[0.229, 0.224, 0.225])
# :对张量进行标准化处理,其中 mean 和 std 是预先计算好的均值和标准差(此处使用的是 ImageNet 数据集的均值和标准差)
])