PyTorch加载数据集主要涉及两个类------Dataset和Dataloader
Dataset类是提供一种方式去获取数据及其对应的真实的label值,Dataset类是需要我们自己写的。
实现的功能:一如何获取每一个数据及其label;二告诉我们总共有多少个数据
Dataloader类是为后面的网络提供不同的数据形式
举个例子:以垃圾分类来举例,其中垃圾就代表我们所要处理的数据。Dataset类的作用是将一堆垃圾进行分类,并在每一类中对垃圾进行0,1,2,......的编号,并获取具体的label值。Dataloader类的作用是将Dataset类编码之后的数据按照一定的大小(比如batch-size)进行打包