数据集相关类代码回顾理解 | StratifiedShuffleSplit\transforms.ToTensor\Counter

【PyTorch】图像多分类项目

目录

StratifiedShuffleSplit

transforms.ToTensor

Counter


StratifiedShuffleSplit

复制代码
sss = StratifiedShuffleSplit(n_splits=1, test_size=0.2, random_state=0)

创建StratifiedShuffleSplit对象,用于将数据集划分为训练集和测试集。

  • n_splits=1:划分次数为1,大于1则多次划分,每次划分生成一组新训练集和新测试集。
  • test_size=0.2:测试集比例为0.2,即测试集的大小占总样本的20%
  • random_state=0:随机种子为0,类似random的种子,保证每次抽样到的数据一样

StratifiedShuffleSplit是scikit-learn库中的一个类,用于创建训练集和测试集的划分,同时保持每个类别中的样本比例一致。核心思想:分层抽样。

StratifiedShuffleSplit 类的工作原理:

先根据每个类别的样本数量将数据集划分为尽可能相等的子集(分层)

然后在这些子集中随机选择样本拆分创建训练集和测试集(随机拆分)

插入空格更好理解:Stratified Shuffle Split分层随机拆分类!

transforms.ToTensor

复制代码
data_transformer = transforms.Compose([transforms.ToTensor()])

transforms.ToTensor()的作用是将PIL图像或NumPy数组转换为PyTorch张量,并且将图像的像素值从0, 255范围缩放到0.0, 1.0范围,即在0.0, 1.0范围内对像素值进行归一化。转换后的张量形状为(C, H, W)

Compose是 torchvision.transforms 模块的一个类,创建一个Compose对象时,需要传入一个包含一个或多个变换操作的列表。Compose对象一般包含四个变换操作:调整图像大小、从中心裁剪图像、将图像转换为张量以及归一化。

Counter

复制代码
counter_train=collections.Counter(y_train)

用于统计图像标签,即每类标签图像数量,Counter是用于计数的子类字典。例如PyTorch torchvision包中STL-10数据集的训练数据集:

相关推荐
Cloud_Shy6186 分钟前
解读《Effective Python 3rd Edition》:从练气到老魔(第六章 Item 40 - 43)
android·开发语言·人工智能·笔记·python·学习方法
装不满的克莱因瓶6 分钟前
掌握生成对抗网络(GAN)的优化目标与评估指标——从博弈函数到生成质量衡量体系
人工智能·python·深度学习·算法·机器学习
半只小闲鱼11 分钟前
配置计划模块通用办公设备家具批复数合计计算
开发语言·python
是阿千呀!11 分钟前
A股市场风格切换研究:基于 Barra 风险模型的量化框架
python·量化
大蚂蚁2号24 分钟前
短视频批量生成技术深度解析与实战方案
python·aigc·音视频
努力写A题的小菜鸡33 分钟前
PyTorch 两种卷积写法彻底对比:F.conv2d 函数式 vs nn.Conv2d 类实战(超详细入门笔记)
python
golfscript33 分钟前
Playwright Python:微软出的浏览器自动化库
python·其他·microsoft·自动化
charliedev38 分钟前
Jedi:Python 自动补全与静态分析的实用工具
开发语言·python·其他
装不满的克莱因瓶1 小时前
自然语言处理中的分词——从语言切分到模型输入的第一步
人工智能·pytorch·python·深度学习·ai·自然语言处理
hnxaoli1 小时前
统信程序(十二)档案归档文件管理
python