【Pytorch】3.Transforms的运用

什么是Transforms

在PyTorch中,transforms是用于对数据进行预处理、增强和变换的操作集合。transforms通常用于数据载入和训练过程中,可以包括数据的归一化、裁剪、翻转、旋转、缩放等操作,以及将数据转换成PyTorch可以处理的Tensor格式。

Transforms的使用

首先导入包

py 复制代码
from torchvision import transforms

实际上是导入了一个文件,文件名为transforms,我们目前主要查看一下其中的ToTensor

我们可以查看一下其中的源码

我们可以看到这个类的主要作用是 将PIL Image或者是numpy.ndarray类型转化为tensor类型

其中的__call__方法,类似于c++重载()运算符

使用PIL image格式

具体的使用就可以通过

py 复制代码
from PIL import Image
from torchvision import transforms

img_path = "dataset/hymenoptera_data/train/ants/0013035.jpg"
PIL_img = Image.open(img_path)
tensor_tans = transforms.ToTensor()     # 通过transforms中的ToTensor类创建一个对象
img = tensor_tans(PIL_img)     # __call__方法类似于c++中重载了()运算符,我们只需要传入PIL_img格式的图像就可以输出tensor格式的图像

print(img)

我们就可以成功地转化为Tensor格式了

使用numpy.ndarray格式

首先我们要先通过pip安装opencv-python这个库,在终端输入

复制代码
pip install opencv-python

安装成功后导入包

py 复制代码
import cv2

然后使用

py 复制代码
cv_img = cv2.imread(img_path)

创建出来的图片格式就是numpy.ndarray格式

为什么要使用Tensor数据类型

Tensor数据类型包括了我们训练神经网络的一系列参数,以及训练神经网络所需要的格式,这是刚刚我们的格式所不具备的

相关推荐
祭曦念5 小时前
古诗小集开发实战:从零开发一款 HarmonyOS 古诗鉴赏应用
pytorch·深度学习·harmonyos
石头城的小石头7 小时前
【从0到1的鼠标位置显示记录器,基于python环境pycharm下编译实施,最终打包为exe,欢迎交流】
python·目标跟踪·pycharm·计算机外设·鼠标
西西弗Sisyphus9 小时前
YOLO26 自定义损失函数 重写 init_criterion 方法 损失类不继承基类
pytorch·python·yolo·yolo11·yolo26
装不满的克莱因瓶11 小时前
自动微分的原理:计算图与前向传播
人工智能·pytorch·python·数学·ai·微积分·计算图
吴佳浩 Alben12 小时前
pytorch 你不学?_EP01_环境准备与安装验证
人工智能·pytorch·python
月疯13 小时前
torch:tensor的运算
人工智能·pytorch·深度学习
m沐沐13 小时前
【计算机视觉】OpenCV 模板匹配银行卡数字识别---上
人工智能·后端·python·opencv·计算机视觉·pycharm·numpy
QBoson13 小时前
Kaiwu-PyTorch-Plugin v0.2.0发布|支持Q-Diffusion,生成任务能力再拓宽
人工智能·pytorch·量子计算·生命科学
装不满的克莱因瓶15 小时前
循环神经网络及LSTM——从序列建模到长期依赖记忆机制
人工智能·pytorch·python·rnn·深度学习·神经网络·lstm
装不满的克莱因瓶16 小时前
NLP中的卷积神经网络CNN——从图像卷积到文本特征提取的跨界应用
人工智能·pytorch·python·深度学习·神经网络·自然语言处理·cnn