数据集相关类代码回顾理解 | StratifiedShuffleSplit\transforms.ToTensor\Counter

【PyTorch】图像多分类项目

目录

StratifiedShuffleSplit

transforms.ToTensor

Counter


StratifiedShuffleSplit

复制代码
sss = StratifiedShuffleSplit(n_splits=1, test_size=0.2, random_state=0)

创建StratifiedShuffleSplit对象,用于将数据集划分为训练集和测试集。

  • n_splits=1:划分次数为1,大于1则多次划分,每次划分生成一组新训练集和新测试集。
  • test_size=0.2:测试集比例为0.2,即测试集的大小占总样本的20%
  • random_state=0:随机种子为0,类似random的种子,保证每次抽样到的数据一样

StratifiedShuffleSplit是scikit-learn库中的一个类,用于创建训练集和测试集的划分,同时保持每个类别中的样本比例一致。核心思想:分层抽样。

StratifiedShuffleSplit 类的工作原理:

先根据每个类别的样本数量将数据集划分为尽可能相等的子集(分层)

然后在这些子集中随机选择样本拆分创建训练集和测试集(随机拆分)

插入空格更好理解:Stratified Shuffle Split分层随机拆分类!

transforms.ToTensor

复制代码
data_transformer = transforms.Compose([transforms.ToTensor()])

transforms.ToTensor()的作用是将PIL图像或NumPy数组转换为PyTorch张量,并且将图像的像素值从[0, 255]范围缩放到[0.0, 1.0]范围,即在[0.0, 1.0]范围内对像素值进行归一化。转换后的张量形状为(C, H, W)

Compose是 torchvision.transforms 模块的一个类,创建一个Compose对象时,需要传入一个包含一个或多个变换操作的列表。Compose对象一般包含四个变换操作:调整图像大小、从中心裁剪图像、将图像转换为张量以及归一化。

Counter

复制代码
counter_train=collections.Counter(y_train)

用于统计图像标签,即每类标签图像数量,Counter是用于计数的子类字典。例如PyTorch torchvision包中STL-10数据集的训练数据集:

相关推荐
A__tao5 小时前
Elasticsearch Mapping 一键生成 Java 实体类(支持嵌套 + 自动过滤注释)
java·python·elasticsearch
研究点啥好呢5 小时前
Github热门项目推荐 | 创建你的像素风格!
c++·python·node.js·github·开源软件
迷藏4945 小时前
**发散创新:基于Rust实现的开源合规权限管理框架设计与实践**在现代软件架构中,**权限控制(RBAC)** 已成为保障
java·开发语言·python·rust·开源
明日清晨5 小时前
python扫码登录dy
开发语言·python
bazhange6 小时前
python如何像matlab一样使用向量化替代for循环
开发语言·python·matlab
人工干智能6 小时前
科普:python中你写的模块找不到了——`ModuleNotFoundError`
服务器·python
unicrom_深圳市由你创科技6 小时前
做虚拟示波器这种实时波形显示的上位机,用什么语言?
c++·python·c#
小敬爱吃饭6 小时前
Ragflow Docker部署及问题解决方案(界面为Welcome to nginx,ragflow上传文件失败,Docker中的ragflow-cpu-1一直重启)
人工智能·python·nginx·docker·语言模型·容器·数据挖掘
宸津-代码粉碎机6 小时前
Spring Boot 4.0虚拟线程实战调优技巧,最大化发挥并发优势
java·人工智能·spring boot·后端·python
知行合一。。。6 小时前
Python--04--数据容器(集合)
python