取Dataset子集(pytorch)

取Dataset子集--pytorch

  • [1. why](#1. why)
  • [2. how](#2. how)
  • [3. example](#3. example)

1. why

我们在调试深度学习代码时,常常会遇到数据集太大,导致调试浪费时间的情况,这种情况下,将数据集中的一个子集拿出来用于调试代码,调试成功在用完整的数据集运行代码成为一个可行的方案。

2. how

pytorch中Torch.utils.data.Subset()函数提供了一个简便的方式,函数如下,indices表示取子集中样本在dataset中的序号。

indices可以由以下的形式输入:

python 复制代码
indices = range(0, 10)    # or
indices = [x for x in range(10)]

3. example

python 复制代码
trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
                                        download=True, transform=transform)
trainset = torch.utils.data.Subset(trainset,[0,1,2,3,4,5,6,7,8,9,10,11])
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,
                                          shuffle=True, num_workers=2)

testset = torchvision.datasets.CIFAR10(root='./data', train=False,
                                       download=True, transform=transform)
testset = torch.utils.data.Subset(testset,[1,2,3,4])
testloader = torch.utils.data.DataLoader(testset, batch_size=4,
                                         shuffle=False, num_workers=2)
相关推荐
ComputerInBook几秒前
代数基本概念理解——特征向量和特征值
人工智能·算法·机器学习·线性变换·特征值·特征向量
开发转测试19 分钟前
python编码笔试题
python
漫长的~以后23 分钟前
Edge TPU LiteRT V2拆解:1GB内存设备也能流畅跑AI的底层逻辑
前端·人工智能·edge
星火102425 分钟前
“重生”之我用 Solo 写了一盘中国象棋
人工智能·ai编程
祝余Eleanor25 分钟前
Day37 模型可视化与推理
人工智能·python·深度学习
是Dream呀26 分钟前
【openFuyao】openFuyao社区AI推理加速组件技术解析与实践
人工智能·架构·openfuyao
sg_knight27 分钟前
Python 面向对象基础复习
开发语言·python·ai编程·面向对象·模型
独自归家的兔29 分钟前
千问通义plus - 代码解释器的使用
java·人工智能
程序员博博29 分钟前
这才是vibe coding正确的打开方式 - 手把手教你开发一个MCP服务
javascript·人工智能·后端
文心快码 Baidu Comate39 分钟前
Comate Spec模式实测:让AI编程更精准可靠
人工智能·ai编程·文心快码·ai编程助手