pytorch入门(1)——pytorch加载数据初认识

环境配置及其安装:

2023最新pytorch安装(超详细版)-CSDN博客

pytorch加载数据初认识

Dataset:创建可被Pytorch使用的数据集

提供一种方式获取数据及其label

Dataloader:向模型传递数据

为网络提供不同的数据形式

代码实战

蚂蚁蜜蜂/练手数据集:链接: https://pan.baidu.com/s/1jZoTmoFzaTLWh4lKBHVbEA 密码: 5suq

train为训练集,val为测试集,可以看到ants里蚂蚁的图片,bees里是蜜蜂的图片

复制代码
from torch.utils.data import Dataset
from PIL import Image
import os

class MyData(Dataset):
    def __init__(self, root_dir, label_dir):
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.path = os.path.join(self.root_dir, self.label_dir)
        # 函数是os模块中的一个重要函数,用于获取指定目录下的所有文件和子目录。
        self.image_path = os.listdir(self.path)

    def __getitem__(self, idx):
        img_name = self.image_path[idx]
        img_item_path = os.path.join(self.root_dir, self.label_dir,img_name)
        img = Image.open(img_item_path)
        label = self.label_dir
        return img, label

    def __len__(self):
        return len(self.image_path)

root_dir = "hymenoptera_data/train"
ants_label_dir = "ants"
bees_label_dir = "ants"
ants_dataset = MyData(root_dir, ants_label_dir)
bees_dataset = MyData(root_dir, bees_label_dir)
train_dataset = ants_dataset + bees_dataset
相关推荐
AIbase202416 分钟前
AI时代企业获取精准流量与实现增长的GEO新引擎
人工智能·搜索引擎·百度
陈敬雷-充电了么-CEO兼CTO17 分钟前
具身智能模拟器:解决机器人实机训练场景局限与成本问题的创新方案
大数据·人工智能·机器学习·chatgpt·机器人·具身智能
东临碣石8221 分钟前
【AI论文】Robix:一种面向机器人交互、推理与规划的统一模型
人工智能
Source.Liu35 分钟前
【Python自动化】 21.1 Pandas 读取 Excel 文件的完整指南
python·自动化·pandas
Hello Mr.Z1 小时前
使用pytorch创建/训练/推理OCR模型
人工智能·pytorch·python
wan5555cn1 小时前
文字生视频的“精准”代码设定的核心原则本质是最小化文本语义与视频内容的KL散度
人工智能·笔记·深度学习·音视频
MediaTea1 小时前
Python 内置函数:pow()
开发语言·python
AndrewHZ1 小时前
【图像处理基石】图像预处理方面有哪些经典的算法?
图像处理·python·opencv·算法·计算机视觉·cv·图像预处理
IT_陈寒1 小时前
Python异步编程的7个致命误区:90%开发者踩过的坑及高效解决方案
前端·人工智能·后端
老猿讲编程1 小时前
存算一体:重构AI计算的革命性技术(1)
人工智能·重构