Transform(二)

常见的transforms里的类:

一、Normalize(归一化):

1、归一化是干什么的:

对图像数据进行预处理,以确保输入模型的数据在相同的尺度上

2、为什么需要归一化:

为了消除奇异值,将数据缩放到一个小范围,这样梯度下降得更快,更容易求解

3、transforms.Normalize(mean, std)

将图像的每个通道(RGB,共3个通道)按特定的均值和标准差进行归一化

meanstd 的值是通常在 ImageNet 数据集上计算得出)

python 复制代码
#Normalize
mean = [0.485, 0.456, 0.406]
std = [0.229, 0.224, 0.225]
normalize=transforms.Normalize(mean,std) #创建归一化工具的实例化对象
img_norm=normalize(img_tensor)
print(img_norm[0][0][0]) #img_norm[0][0][0]获取该单张图像的第一个通道的第一行的第一个像素值
print(img_norm.shape) #CHW
writer.add_image("Normalize_images",img_norm,4,dataformats="CHW")

二、Resize(改变像素的大小)

注意:这里改变的大小是指改变图片的像素值,调整清晰度

resize=transforms.Resize(size) 中的 size 可以是一个元组 (height, width) 或者一个整数

(如果是整数,图像的较短边会被调整到这个值,较长边会保持比例)

python 复制代码
#Resizes
resize=transforms.Resize((700,50)) #注意size参数是()括起来的一对值
img_resize=resize(img_tensor) #输入:PIL Image or Tensor 对应输出的也是PIL Image or Tensor
writer.add_image("Resize_img",img_resize,1)

三、Compose(按顺序应用多个变换)

参数是list of ``Transform`` objects

python 复制代码
trans_resize=transforms.Resize(512)
trans_compose=transforms.Compose([trans_resize,trans_tensor])
img_resize_2=trans_compose(img_PIL)
writer.add_image("Compose",img_resize_2,1)
print(type(img_resize_2))

四、RandomCrop(随意裁剪)

python 复制代码
# RandomCrop
trans_random=transforms.RandomCrop((200,300))
trans_compose_2=transforms.Compose([trans_random,trans_tensor])
for i in range(10):
    img_crop=trans_compose_2(img_PIL)
    writer.add_image("RandomCrop1",img_crop,i)
  • size 参数可以是一个元组 (height, width),表示裁剪的目标大小
  • 每次应用时,裁剪的位置都是随机的,增加了数据的多样性

Resize 是统一调整大小,而 RandomCrop 是随机选择部分区域)

补充:

python 复制代码
from torch.utils.tensorboard import  SummaryWriter
from torchvision import transforms
from PIL import Image

Tips:

多看官方文档

关注输入和输出类型

关注方法需要什么参数

不知道返回值的时候,可以print()或print(type())或debug

相关推荐
寻丶幽风3 小时前
论文阅读笔记——双流网络
论文阅读·笔记·深度学习·视频理解·双流网络
CM莫问5 小时前
<论文>(微软)避免推荐域外物品:基于LLM的受限生成式推荐
人工智能·算法·大模型·推荐算法·受限生成
康谋自动驾驶6 小时前
康谋分享 | 自动驾驶仿真进入“标准时代”:aiSim全面对接ASAM OpenX
人工智能·科技·算法·机器学习·自动驾驶·汽车
深蓝学院7 小时前
密西根大学新作——LightEMMA:自动驾驶中轻量级端到端多模态模型
人工智能·机器学习·自动驾驶
归去_来兮7 小时前
人工神经网络(ANN)模型
人工智能·机器学习·人工神经网络
2201_754918417 小时前
深入理解卷积神经网络:从基础原理到实战应用
人工智能·神经网络·cnn
强盛小灵通专卖员7 小时前
DL00219-基于深度学习的水稻病害检测系统含源码
人工智能·深度学习·水稻病害
Luke Ewin8 小时前
CentOS7.9部署FunASR实时语音识别接口 | 部署商用级别实时语音识别接口FunASR
人工智能·语音识别·实时语音识别·商用级别实时语音识别
白熊1888 小时前
【计算机视觉】OpenCV实战项目:Face-Mask-Detection 项目深度解析:基于深度学习的口罩检测系统
深度学习·opencv·计算机视觉
Joern-Lee8 小时前
初探机器学习与深度学习
人工智能·深度学习·机器学习