pytorch入门(1)——pytorch加载数据初认识

环境配置及其安装:

2023最新pytorch安装(超详细版)-CSDN博客

pytorch加载数据初认识

Dataset:创建可被Pytorch使用的数据集

提供一种方式获取数据及其label

Dataloader:向模型传递数据

为网络提供不同的数据形式

代码实战

蚂蚁蜜蜂/练手数据集:链接: https://pan.baidu.com/s/1jZoTmoFzaTLWh4lKBHVbEA 密码: 5suq

train为训练集,val为测试集,可以看到ants里蚂蚁的图片,bees里是蜜蜂的图片

复制代码
from torch.utils.data import Dataset
from PIL import Image
import os

class MyData(Dataset):
    def __init__(self, root_dir, label_dir):
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.path = os.path.join(self.root_dir, self.label_dir)
        # 函数是os模块中的一个重要函数,用于获取指定目录下的所有文件和子目录。
        self.image_path = os.listdir(self.path)

    def __getitem__(self, idx):
        img_name = self.image_path[idx]
        img_item_path = os.path.join(self.root_dir, self.label_dir,img_name)
        img = Image.open(img_item_path)
        label = self.label_dir
        return img, label

    def __len__(self):
        return len(self.image_path)

root_dir = "hymenoptera_data/train"
ants_label_dir = "ants"
bees_label_dir = "ants"
ants_dataset = MyData(root_dir, ants_label_dir)
bees_dataset = MyData(root_dir, bees_label_dir)
train_dataset = ants_dataset + bees_dataset
相关推荐
rgeshfgreh3 分钟前
Python条件与循环实战指南
python
Aurora-Borealis.4 分钟前
Day27 机器学习流水线
人工智能·机器学习
rgeshfgreh7 分钟前
通达信LC1文件结构解析指南
python
歌_顿7 分钟前
知识蒸馏学习总结
人工智能·算法
老吴学AI11 分钟前
系列报告九:(埃森哲)The New Rules of Platform Strategy in the Age of Agentic AI
人工智能
棒棒的皮皮13 分钟前
【深度学习】YOLO模型速度优化Checklist
人工智能·深度学习·yolo·计算机视觉
七夜zippoe21 分钟前
事件驱动架构:构建高并发松耦合系统的Python实战
开发语言·python·架构·eda·事件驱动
Kratzdisteln35 分钟前
【MVCD】PPT提纲汇总
经验分享·python
意疏1 小时前
节点小宝4.0 正式发布:一键直达,重新定义远程控制!
人工智能
一个无名的炼丹师1 小时前
GraphRAG深度解析:从原理到实战,重塑RAG检索增强生成的未来
人工智能·python·rag