【Pytorch】3.Transforms的运用

什么是Transforms

在PyTorch中,transforms是用于对数据进行预处理、增强和变换的操作集合。transforms通常用于数据载入和训练过程中,可以包括数据的归一化、裁剪、翻转、旋转、缩放等操作,以及将数据转换成PyTorch可以处理的Tensor格式。

Transforms的使用

首先导入包

py 复制代码
from torchvision import transforms

实际上是导入了一个文件,文件名为transforms,我们目前主要查看一下其中的ToTensor

我们可以查看一下其中的源码

我们可以看到这个类的主要作用是 将PIL Image或者是numpy.ndarray类型转化为tensor类型

其中的__call__方法,类似于c++重载()运算符

使用PIL image格式

具体的使用就可以通过

py 复制代码
from PIL import Image
from torchvision import transforms

img_path = "dataset/hymenoptera_data/train/ants/0013035.jpg"
PIL_img = Image.open(img_path)
tensor_tans = transforms.ToTensor()     # 通过transforms中的ToTensor类创建一个对象
img = tensor_tans(PIL_img)     # __call__方法类似于c++中重载了()运算符,我们只需要传入PIL_img格式的图像就可以输出tensor格式的图像

print(img)

我们就可以成功地转化为Tensor格式了

使用numpy.ndarray格式

首先我们要先通过pip安装opencv-python这个库,在终端输入

复制代码
pip install opencv-python

安装成功后导入包

py 复制代码
import cv2

然后使用

py 复制代码
cv_img = cv2.imread(img_path)

创建出来的图片格式就是numpy.ndarray格式

为什么要使用Tensor数据类型

Tensor数据类型包括了我们训练神经网络的一系列参数,以及训练神经网络所需要的格式,这是刚刚我们的格式所不具备的

相关推荐
Esaka_Forever8 小时前
PyCharm 社区版无法识别 .db 文件类型
数据库·ide·pycharm
小明_GLC10 小时前
Opencode Go接入Claude Code
pycharm·claude code·open code
努力学习_小白20 小时前
ResNeXt-50——学习记录
pytorch·深度学习·学习
小草cys1 天前
NVIDIA 驱动(550版本)成功安装后安装支持 GPU 加速的 PyTorch
人工智能·pytorch·python
Molly_Yu1 天前
深度学习入门:softmax回归的总结
pytorch
栈溢出了1 天前
PyTorch 中 unfold 的理解笔记
人工智能·pytorch·笔记
烛之武2 天前
Pytorch学习笔记(1)
pytorch·笔记·学习
${王小剑}2 天前
在pycharm中配置pyside6
ide·python·pycharm
技术小黑2 天前
CNN算法实战系列05 | SE注意力机制改造 ResDenseNet
人工智能·pytorch·cnn