YOLOv5 分类模型的预处理

YOLOv5 分类模型的预处理

flyfish

版本 6.2

将整个代码简化成如下代码

py 复制代码
imgsz=224
file = "/home/a/Pictures/1.jpg"
transforms = classify_transforms(imgsz)
im = cv2.cvtColor(cv2.imread(file), cv2.COLOR_BGR2RGB)
print(im.shape)

im = transforms(im)
print(im.shape)

im = im.unsqueeze(0).to("cpu")
print(im.shape)

(511, 306, 3) H,W,C顺序

torch.Size([3, 224, 224]) 经过transforms后

torch.Size([1, 3, 224, 224]) 通过unsqueeze扩展增加一维,最后是NCHW的维度进入模型

图像经过了如下变换

python 复制代码
def classify_transforms(size=224):
    # Transforms to apply if albumentations not installed
    return T.Compose([T.ToTensor(), T.Resize(size), T.CenterCrop(size), T.Normalize(IMAGENET_MEAN, IMAGENET_STD)])

最重要的是这两个

py 复制代码
T.Resize(size)
T.CenterCrop(size)

分步演示

T.Resize(size) 图像的缩放

看一个参数还是两个参数

如果是一个参数int,那么图像的较小边将与该参数匹配,然后进行缩放,高宽比例不变。

如果是(h, w),那么图像就缩放到(h, w)大小。

举个例子

如果 height > width 那么图片会被缩放到 (size * height / width, size).比例不变

参考:https://pytorch.org/vision/main/generated/torchvision.transforms.Resize.html

复制代码
import matplotlib.pyplot as plt
from PIL import Image
from torchvision import transforms

file_path = "./1.jpg"
img = Image.open(file)
print("Original:", img.size)

用了PIL库 是 宽w,高h 顺序

原始大小 宽w,高h Original: (306, 511)

复制代码
trans0 = transforms.Compose([transforms.Resize(imgsz)]) 
after0 = trans0(img)

print("Resize:", after0.size)
after0.save('2.jpg')

经过Resize之后 宽w,高h Resize: (224, 374)

复制代码
trans1 = transforms.Compose([transforms.CenterCrop(imgsz)])
after1 = trans1(after0)
print("CenterCrop:", after1.size)
after1.save('3.jpg')

经过中心剪裁后 CenterCrop: (224, 224)

相关推荐
有Li4 小时前
通过具有一致性嵌入的大语言模型实现端到端乳腺癌放射治疗计划制定|文献速递-最新论文分享
论文阅读·深度学习·分类·医学生
学技术的大胜嗷8 小时前
离线迁移 Conda 环境到 Windows 服务器:用 conda-pack 摆脱硬路径限制
人工智能·深度学习·yolo·目标检测·机器学习
加油吧zkf14 小时前
目标检测新纪元:DETR到Mamba实战解析
图像处理·人工智能·python·目标检测·分类
羊小猪~~17 小时前
【NLP入门系列四】评论文本分类入门案例
人工智能·自然语言处理·分类
蓝婷儿1 天前
Python 机器学习核心入门与实战进阶 Day 1 - 分类 vs 回归
python·机器学习·分类
.30-06Springfield1 天前
利用人名语言分类案例演示RNN、LSTM和GRU的区别(基于PyTorch)
人工智能·pytorch·python·rnn·分类·gru·lstm
一花·一叶1 天前
基于昇腾310B4的YOLOv8目标检测推理
yolo·目标检测·边缘计算
昵称是6硬币1 天前
YOLOv11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS目标检测论文精读(逐段解析)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉
归去_来兮1 天前
支持向量机(SVM)分类
机器学习·支持向量机·分类
OICQQ676580081 天前
创建一个基于YOLOv8+PyQt界面的驾驶员疲劳驾驶检测系统 实现对驾驶员疲劳状态的打哈欠检测,头部下垂 疲劳眼睛检测识别
yolo·pyqt·疲劳驾驶·检测识别·驾驶员检测·打哈欠检测·眼睛疲劳