torchvision.datasets.ImageFolder

文章目录

什么是ImageFolder

torchvision.datasets.ImageFolder 是 PyTorch 中 torchvision 库提供的一个用于加载图像数据集的类,特别适用于处理按类别组织的图像数据集。通过使用 ImageFolder 类,你可以轻松地加载包含图像数据的文件夹,并且该类会自动根据文件夹结构解析出每个类别的图像数据

用代码来理解

假设我们有一个图像数据集,包含两个类别:"cat" 和 "dog",每个类别各有一些图像。数据集的目录结构如下:

dataset/

├── cat/

│ ├── cat001.jpg

│ ├── cat002.jpg

│ └── ...

└── dog/

├── dog001.jpg

├── dog002.jpg

└── ...

在这个例子中,"dataset" 文件夹下有一个名为 "cat" 的子文件夹和一个名为 "dog" 的子文件夹,分别存放了 "cat" 类别和 "dog" 类别的图像。每个子文件夹中包含该类别的多张图像。

接下来,我们可以使用 ImageFolder 类来加载这个数据集,并查看返回的内容是什么:

python 复制代码
import torch
from torchvision import datasets, transforms

# 定义数据转换
transform = transforms.Compose([
    transforms.Resize((224, 224)),  # 调整图像大小
    transforms.ToTensor(),           # 将图像转换为Tensor
])

# 加载数据集
dataset = datasets.ImageFolder('dataset', transform=transform)

# 查看数据集中的内容
print(dataset.classes)  # 打印类别列表
print(dataset.class_to_idx)  # 打印类别到索引的映射
print(dataset.imgs)  # 打印图像路径列表

dataset.classes 返回的结果会是 ['cat', 'dog'],表示数据集中包含的类别

dataset.class_to_idx 返回的结果可能是 {'cat': 0, 'dog': 1},表示每个类别对应的索引

而 dataset.imgs 则会返回一个列表,其中每个元素对应一个元组 (image_path, class_index),包含了图像的路径和对应的类别索引。

用法

python 复制代码
import torch
from torchvision import datasets, transforms

# 定义数据转换
transform = transforms.Compose([
    transforms.Resize((224, 224)),  # 调整图像大小
    transforms.ToTensor(),           # 将图像转换为Tensor
])

# 加载数据集
dataset = datasets.ImageFolder('path/to/dataset', transform=transform)

# 创建数据加载器
data_loader = torch.utils.data.DataLoader(dataset, batch_size=32, shuffle=True)
相关推荐
Lethehong31 分钟前
昇腾Atlas 800T平台下Qwen-14B大语言模型的SGLang适配与性能实测
人工智能·语言模型·sglang·昇腾npu
杜子不疼.33 分钟前
Spring AI 与向量数据库:构建企业级 RAG 智能问答系统
数据库·人工智能·spring
ayingmeizi16335 分钟前
AI CRM赋能全链路数字化如何重塑医械企业渠道竞争力?
人工智能
————A36 分钟前
从 RAG 召回失败到故障链推理
人工智能·rag
Chase_______1 小时前
AI提效指南:Nano Banana 生成精美PPT与漫画
人工智能·powerpoint
雨大王5122 小时前
汽车产业供应链优化的可行策略及案例分析
人工智能·机器学习
梁辰兴2 小时前
三星自研GPU剑指AI芯片霸权,2027年能否撼动英伟达?
人工智能·gpu·芯片·电子·ai芯片·三星·梁辰兴
吴佳浩8 小时前
Python入门指南(七) - YOLO检测API进阶实战
人工智能·后端·python
tap.AI8 小时前
RAG系列(二)数据准备与向量索引
开发语言·人工智能
老蒋新思维9 小时前
知识IP的长期主义:当AI成为跨越增长曲线的“第二曲线引擎”|创客匠人
大数据·人工智能·tcp/ip·机器学习·创始人ip·创客匠人·知识变现