动手学深度学习(pytorch土堆)-03常见的Transforms

Compose

transforms.Compose 是 PyTorch 中的一个函数,用于将多个图像变换操作组合在一起,形成一个变换流水线。这样可以将一系列的图像处理操作整合为一个步骤,便于对图像进行批量预处理或增强。

基本用法

transforms.Compose 接受一个列表,列表中的每个元素是一个变换操作。这些操作会按照给定的顺序依次作用在输入的图像上。

c 复制代码
  Example:
        >>> transforms.Compose([
        >>>     transforms.CenterCrop(10),
        >>>     transforms.PILToTensor(),
        >>>     transforms.ConvertImageDtype(torch.float),
        >>> ])
c 复制代码
#compose
trans_resize1=transforms.Resize((512,512))
trans_compose=transforms.Compose([trans_resize1,tensor_trans])
img_resize_1=trans_compose(img)

ToTensor

将图片变为Tensor数据类型

normalize(归一化)

计算公式:output[channel] = (input[channel] - mean[channel](均值)) / std[channel](标准差)

c 复制代码
Normalize

print(tensor_img[0][0][0])
trans_norm=transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
img_norm= trans_norm(tensor_img)
print(img_norm[0][0][0])
writer.add_image("Noramlize",img_norm)
writer.close()

归一化图片前后对比

Resize

transforms.Resize 是 PyTorch 中 torchvision.transforms 模块的一个变换操作,用于调整图像的大小。它可以将输入图像调整为指定的尺寸,通常用于图像预处理以确保所有输入图像具有相同的尺寸,这对深度学习模型的输入非常重要。

size: 目标尺寸,可以是单个整数或一个元组 (height, width)。

如果是单个整数:将按保持宽高比的方式调整图像,较短的一边将被调整为该值。

如果是元组 (height, width):将直接调整图像为指定的高度和宽度。

c 复制代码
#Resize
print(img.size)
trans_resize=transforms.Resize((512,512))
img_resize =trans_resize(img)
img_resize_tensor=tensor_trans(img_resize)
print(img_resize_tensor)
writer.add_image("img_resize",img_resize_tensor,0)
writer.close()

整体代码

c 复制代码
from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from torchvision.transforms import ToTensor

img_path="hymenoptera_data/train/ants/0013035.jpg"
img=Image.open(img_path)
writer=SummaryWriter("logs")
tensor_trans=ToTensor()
tensor_img=tensor_trans(img)#将img图片转换成tensor数据类型的图片
# print(tensor_img)
writer.add_image("img",tensor_img,2)

#Normalize
print(tensor_img[0][0][0])
trans_norm=transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
img_norm= trans_norm(tensor_img)
print(img_norm[0][0][0])
writer.add_image("Noramlize",img_norm,1)
#Resize
print(img.size)
trans_resize=transforms.Resize((512,512))
img_resize =trans_resize(img)
img_resize_tensor=tensor_trans(img_resize)
print(img_resize_tensor)
writer.add_image("img_resize",img_resize_tensor,0)
#compose
trans_resize1=transforms.Resize((512,512))
trans_compose=transforms.Compose([trans_resize1,tensor_trans])
img_resize_1=trans_compose(img)
writer.close()
相关推荐
Chef_Chen1 小时前
从0开始学习计算机视觉--Day09--卷积与池化
深度学习·学习·计算机视觉
charley.layabox5 小时前
8月1日ChinaJoy酒会 | 游戏出海高端私享局 | 平台 × 发行 × 投资 × 研发精英畅饮畅聊
人工智能·游戏
DFRobot智位机器人6 小时前
AIOT开发选型:行空板 K10 与 M10 适用场景与选型深度解析
人工智能
想成为风筝8 小时前
从零开始学习深度学习—水果分类之PyQt5App
人工智能·深度学习·计算机视觉·pyqt
F_D_Z8 小时前
MMaDA:多模态大型扩散语言模型
人工智能·语言模型·自然语言处理
大知闲闲哟8 小时前
深度学习G2周:人脸图像生成(DCGAN)
人工智能·深度学习
飞哥数智坊9 小时前
Coze实战第15讲:钱都去哪儿了?Coze+飞书搭建自动记账系统
人工智能·coze
wenzhangli79 小时前
低代码引擎核心技术:OneCode常用动作事件速查手册及注解驱动开发详解
人工智能·低代码·云原生
潘达斯奈基~10 小时前
大模型的Temperature、Top-P、Top-K、Greedy Search、Beem Search
人工智能·aigc
倔强青铜三10 小时前
苦练Python第18天:Python异常处理锦囊
人工智能·python·面试