pytorch入门(1)——pytorch加载数据初认识

环境配置及其安装:

2023最新pytorch安装(超详细版)-CSDN博客

pytorch加载数据初认识

Dataset:创建可被Pytorch使用的数据集

提供一种方式获取数据及其label

Dataloader:向模型传递数据

为网络提供不同的数据形式

代码实战

蚂蚁蜜蜂/练手数据集:链接: https://pan.baidu.com/s/1jZoTmoFzaTLWh4lKBHVbEA 密码: 5suq

train为训练集,val为测试集,可以看到ants里蚂蚁的图片,bees里是蜜蜂的图片

复制代码
from torch.utils.data import Dataset
from PIL import Image
import os

class MyData(Dataset):
    def __init__(self, root_dir, label_dir):
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.path = os.path.join(self.root_dir, self.label_dir)
        # 函数是os模块中的一个重要函数,用于获取指定目录下的所有文件和子目录。
        self.image_path = os.listdir(self.path)

    def __getitem__(self, idx):
        img_name = self.image_path[idx]
        img_item_path = os.path.join(self.root_dir, self.label_dir,img_name)
        img = Image.open(img_item_path)
        label = self.label_dir
        return img, label

    def __len__(self):
        return len(self.image_path)

root_dir = "hymenoptera_data/train"
ants_label_dir = "ants"
bees_label_dir = "ants"
ants_dataset = MyData(root_dir, ants_label_dir)
bees_dataset = MyData(root_dir, bees_label_dir)
train_dataset = ants_dataset + bees_dataset
相关推荐
飞哥数智坊1 小时前
openclaw 重大更新,真的懂我啊
人工智能
KaneLogger1 小时前
AI 时代编程范式迁移的思考
人工智能·程序员·代码规范
飞哥数智坊1 小时前
养虾记第2期:从“人工智障”到“赛博分身”,你的龙虾还缺这两个灵魂
人工智能
飞哥数智坊1 小时前
龙虾虽香,小心扎手!官方点名后,我们该怎么“养虾”?
人工智能
yiyu07162 小时前
3分钟搞懂深度学习AI:实操篇:卷积层
人工智能·深度学习
曲幽2 小时前
数据库实战:FastAPI + SQLAlchemy 2.0 + Alembic 从零搭建,踩坑实录
python·fastapi·web·sqlalchemy·db·asyncio·alembic
字节架构前端3 小时前
Skill再回首—深度解读Anthropic官方最新Skill白皮书
人工智能·agent·ai编程
冬奇Lab4 小时前
OpenClaw 深度解析(八):Skill 系统——让 LLM 按需学习工作流
人工智能·开源·源码阅读
冬奇Lab4 小时前
一天一个开源项目(第45篇):OpenAI Agents SDK Python - 轻量级多 Agent 工作流框架,支持 100+ LLM 与实时语音
人工智能·开源·openai