【Pytorch】3.Transforms的运用

什么是Transforms

在PyTorch中,transforms是用于对数据进行预处理、增强和变换的操作集合。transforms通常用于数据载入和训练过程中,可以包括数据的归一化、裁剪、翻转、旋转、缩放等操作,以及将数据转换成PyTorch可以处理的Tensor格式。

Transforms的使用

首先导入包

py 复制代码
from torchvision import transforms

实际上是导入了一个文件,文件名为transforms,我们目前主要查看一下其中的ToTensor

我们可以查看一下其中的源码

我们可以看到这个类的主要作用是 将PIL Image或者是numpy.ndarray类型转化为tensor类型

其中的__call__方法,类似于c++重载()运算符

使用PIL image格式

具体的使用就可以通过

py 复制代码
from PIL import Image
from torchvision import transforms

img_path = "dataset/hymenoptera_data/train/ants/0013035.jpg"
PIL_img = Image.open(img_path)
tensor_tans = transforms.ToTensor()     # 通过transforms中的ToTensor类创建一个对象
img = tensor_tans(PIL_img)     # __call__方法类似于c++中重载了()运算符,我们只需要传入PIL_img格式的图像就可以输出tensor格式的图像

print(img)

我们就可以成功地转化为Tensor格式了

使用numpy.ndarray格式

首先我们要先通过pip安装opencv-python这个库,在终端输入

复制代码
pip install opencv-python

安装成功后导入包

py 复制代码
import cv2

然后使用

py 复制代码
cv_img = cv2.imread(img_path)

创建出来的图片格式就是numpy.ndarray格式

为什么要使用Tensor数据类型

Tensor数据类型包括了我们训练神经网络的一系列参数,以及训练神经网络所需要的格式,这是刚刚我们的格式所不具备的

相关推荐
拾零吖2 小时前
CS336 Lecture_03
人工智能·pytorch·深度学习
盼小辉丶2 小时前
视觉Transformer实战 | Token-to-Token Vision Transformer(T2T-ViT)详解与实现
pytorch·深度学习·计算机视觉·transformer
二川bro3 小时前
基于PyTorch的视觉检测2025:YOLO实战与优化
pytorch·yolo·视觉检测
testtraveler7 小时前
[Fix] ImportError: libtorch_cpu.so: undefined symbol: iJIT_NotifyEvent
pytorch·python·bug
koo3649 小时前
pytorch环境配置
人工智能·pytorch·python
希露菲叶特格雷拉特15 小时前
PyTorch深度学习进阶(四)(数据增广)
人工智能·pytorch·深度学习
田里的水稻19 小时前
NN_Transformer、Pytorch、TensorFlow和ONNX的名词辨析
pytorch·tensorflow·transformer
m0_5284892521 小时前
Pycharm修改系统缓存路径(包含config, system, plugins, logs, remote sources等)
ide·python·pycharm·c盘
中医正骨葛大夫21 小时前
一文解决如何在Pycharm中创建cuda深度学习环境?
pytorch·深度学习·pycharm·软件安装·cuda·anaconda·配置环境
Franklin21 小时前
AI Coding 基础实践03 - Trae AI在Pycharm中的使用02 - 读取不了项目的文件问题解决
ide·python·pycharm