PyTorch加载数据集

33721*22024-08-08 16:27

PyTorch加载数据集主要涉及两个类------Dataset和Dataloader

Dataset类是提供一种方式去获取数据及其对应的真实的label值，Dataset类是需要我们自己写的。

实现的功能：一如何获取每一个数据及其label；二告诉我们总共有多少个数据

Dataloader类是为后面的网络提供不同的数据形式

举个例子：以垃圾分类来举例，其中垃圾就代表我们所要处理的数据。Dataset类的作用是将一堆垃圾进行分类，并在每一类中对垃圾进行0，1，2，......的编号，并获取具体的label值。Dataloader类的作用是将Dataset类编码之后的数据按照一定的大小（比如batch-size）进行打包