分类模型训练pil、torchvision.transforms和opencv的resize

cv-daily2023-09-12 20:55

训练时用pil读取图片，使用torchvision.transforms.Resize 进行数据处理。因为transforms.Resize当输入为PIL图像时，默认使用的PIL的resize进行处理，除了默认的双线性插值，还会进行antialiasing。

PyTorch 中的 torchvision.transforms.Resize 就是采用的 PIL 的 resize。

部署的时候使用opcv的resize处理，发现不一致，最好在训练的时候统一用opencv处理图片。

transforms.Resize 和 PIL 的 resize 的插值方式有区别吗？

A：是的，transforms.Resize 和 PIL 的 resize 的默认插值方式是不同的。

在 transforms.Resize 中，默认使用的是 PIL.Image.BILINEAR，即双线性插值。而在 PIL 的 resize 中，默认使用的是 PIL.Image.BICUBIC，即三次样条插值。

当然，transforms.Resize 也可以指定其他的插值方式，如 PIL.Image.NEAREST（最近邻插值）、PIL.Image.BICUBIC 等。同样地，也可以在 PIL 的 resize 中指定其他的插值方式。