分类模型训练pil、torchvision.transforms和opencv的resize

参考:https://blog.csdn.net/weixin_41012399/article/details/126049885

https://www.cnpython.com/qa/1291644

https://blog.csdn.net/weixin_44966641/article/details/125084573

https://blog.csdn.net/IEEE_FELLOW/article/details/115536987

训练时用pil读取图片,使用torchvision.transforms.Resize 进行数据处理。因为transforms.Resize当输入为PIL图像时,默认使用的PIL的resize进行处理,除了默认的双线性插值,还会进行antialiasing。

PyTorch 中的 torchvision.transforms.Resize 就是采用的 PIL 的 resize。

部署的时候使用opcv的resize处理,发现不一致,最好在训练的时候统一用opencv处理图片。

transforms.Resize 和 PIL 的 resize 的插值方式有区别吗?

A:是的,transforms.Resize 和 PIL 的 resize 的默认插值方式是不同的。

在 transforms.Resize 中,默认使用的是 PIL.Image.BILINEAR,即双线性插值。而在 PIL 的 resize 中,默认使用的是 PIL.Image.BICUBIC,即三次样条插值。

当然,transforms.Resize 也可以指定其他的插值方式,如 PIL.Image.NEAREST(最近邻插值)、PIL.Image.BICUBIC 等。同样地,也可以在 PIL 的 resize 中指定其他的插值方式。

相关推荐
我材不敲代码12 小时前
OpenCV实战:全自动答题卡识别与评分系统
人工智能·opencv·计算机视觉
badhope14 小时前
概率论如何让机器学习不再玄学
人工智能·深度学习·机器学习·数据挖掘·github
编程界一哥15 小时前
R6S DX12画面撕裂怎么设置 2026:从驱动到游戏内的完整调优步骤
数据挖掘
li三河15 小时前
opencv利用freetype写中文
人工智能·opencv·计算机视觉
badhope16 小时前
10个高星GitHub项目推荐
python·深度学习·计算机视觉·数据挖掘·github
旺仔Sec20 小时前
2026江苏省职业院校技能大赛新一代信息技术赛道大数据应用开发项目样题
大数据·数据挖掘
AI科技星20 小时前
基于四维时空光速不变公设的量子几何与量子力学本质全维度推导验证
开发语言·人工智能·opencv·计算机视觉·数学建模·r语言
纤纡.21 小时前
实战 OpenCV:从文档扫描到目标追踪,四大核心场景全解析
人工智能·opencv·计算机视觉
阿钱真强道21 小时前
03 从 MLP 到 LeNet:一个分类模型,究竟是怎样做出判断的?
人工智能·分类·图像分类·softmax·多层感知机
明月醉窗台1 天前
[Jetson] 在Jetson Xavier AGX编译opencv+cuda
人工智能·opencv·计算机视觉·cuda·jetson