PyTorch|transforms

在将图片输入到神经网络进行训练时,一般都需要对输入的图像进行预处理。对图片进行操作有很多种方法,这里我们使用torchvision库的transforms模块

tansforms有很多种方法(一些可以用在张量和PIL图像,一些仅能用于张量,而另一些仅能用于PIL图像),这些方法极大的为我们的图片处理工作提供了便利。

我们使用PIL库读取一个图片,在调用transform的Resize方法,改变图片的大小:

复制代码
>>> from PIL import Image>>> from torchvision import transforms>>> path="E:\\3-10\\dogandcats\\train\\cat13.0.jpg">>> img=Image.open(path)>>> img.size(700, 467)>>> process=transforms.Resize((28,28))>>> img2=process(img)>>> img2.size(28, 28)

同样,我们还可以把原始的图片数据转换为张量:​​​​​​​

复制代码
>>> process=transforms.ToTensor()>>> imgdata=process(img)>>> imgdata.size()torch.Size([3, 467, 700])

同样,归一化也变得非常的容易​​​​​​​

复制代码
>>> process=transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))>>> process(img)

当然,我们对图片预处理时可能不仅仅使用一种方法,那么有没有一种方法将这些操作整合到一起呢?显然,库的作者早已考虑到,并且已经实现了此功能。

借助Compose方法,我们可以集成上述操作。​​​​​​​

复制代码
>>> process=transforms.Compose([transforms.Resize((28,28)),              transforms.ToTensor(),              transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))])>>> process(img)

当然,transforms提供了多种对图片数据操作的方法,详细的可以看这里:

https://pytorch.org/vision/stable/transforms.html

到了这里,你已经对图像处理有了一定的了解,好吧,那么让我们回到上一篇文章:卷积神经网络|制作自己的Dataset

在这里,我们实现了自己的数据集,在__init__方法,有两个参数分别叫做transform,和label_transform,分别对图片和图片标签进行处理,默认为none,也就是无操作。

这时,很明显,我们可以传入对图片的一系列操作,就像这样:​​​​​​​

复制代码
path="E:\\3-10\\dogandcats\\train"training_data=MyDataset(path,transform=transforms.Compose([    transforms.Resize((16,16)),    transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))    ]))

到这里,对于自己数据集的准备工作基本已经完成!

相关推荐
zh1570234 小时前
JavaScript中WorkerThreads解决服务端计算瓶颈
jvm·数据库·python
马丁聊GEO4 小时前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker4 小时前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.4 小时前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑4 小时前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
深海鱼在掘金4 小时前
深入浅出 LangChain —— 第三章:模型抽象层
人工智能·langchain·agent
生信碱移4 小时前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
workflower5 小时前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
蜡台5 小时前
Python包管理工具pip完全指南-----2
linux·windows·python
Mr.朱鹏5 小时前
【Python 进阶 | 第四篇】Psycopg3 + Flask 实现 PostgreSQL CRUD 全流程:从连接池到RESTful接口
python·postgresql·flask·virtualenv·fastapi·pip·tornado