分类模型训练pil、torchvision.transforms和opencv的resize

参考:https://blog.csdn.net/weixin_41012399/article/details/126049885

https://www.cnpython.com/qa/1291644

https://blog.csdn.net/weixin_44966641/article/details/125084573

https://blog.csdn.net/IEEE_FELLOW/article/details/115536987

训练时用pil读取图片,使用torchvision.transforms.Resize 进行数据处理。因为transforms.Resize当输入为PIL图像时,默认使用的PIL的resize进行处理,除了默认的双线性插值,还会进行antialiasing。

PyTorch 中的 torchvision.transforms.Resize 就是采用的 PIL 的 resize。

部署的时候使用opcv的resize处理,发现不一致,最好在训练的时候统一用opencv处理图片。

transforms.Resize 和 PIL 的 resize 的插值方式有区别吗?

A:是的,transforms.Resize 和 PIL 的 resize 的默认插值方式是不同的。

在 transforms.Resize 中,默认使用的是 PIL.Image.BILINEAR,即双线性插值。而在 PIL 的 resize 中,默认使用的是 PIL.Image.BICUBIC,即三次样条插值。

当然,transforms.Resize 也可以指定其他的插值方式,如 PIL.Image.NEAREST(最近邻插值)、PIL.Image.BICUBIC 等。同样地,也可以在 PIL 的 resize 中指定其他的插值方式。

相关推荐
2501_9418372618 小时前
CV医疗应用:基于YOLOv8-RepHGNetV2的疟疾寄生虫细胞形态检测与分类系统
yolo·分类·数据挖掘
小鸡吃米…1 天前
机器学习中的分类算法
人工智能·机器学习·分类
绝不原创的飞龙1 天前
K 最近邻回归器,解释:带代码示例的视觉指南
人工智能·数据挖掘·回归
爱打代码的小林1 天前
opencv基础(轮廓检测、绘制与特征)
人工智能·opencv·计算机视觉
lxs-1 天前
使用 OpenCV 进行图像识别:人脸与物体检测
人工智能·opencv·计算机视觉
高洁011 天前
产品数字孪生体与数字样机及数字化交付的应用
人工智能·深度学习·算法·数据挖掘·transformer
2501_941507941 天前
通信基站天线设备检测与分类YOLO11-LSCD-LQE算法实现与优化
算法·分类·数据挖掘
明月醉窗台1 天前
Ryzen AI --- AMD XDNA架构的部署框架
人工智能·opencv·目标检测·机器学习·计算机视觉·架构
飞Link1 天前
指令调整阶段中的通用模型蒸馏、模型自我提升和数据扩充
python·算法·数据挖掘
2501_941507941 天前
使用_ssd300_训练蘑菇分类数据集经验总结_毒菇与食用菇自动识别研究
人工智能·分类·数据挖掘