pytorch入门(1)——pytorch加载数据初认识

环境配置及其安装:

2023最新pytorch安装(超详细版)-CSDN博客

pytorch加载数据初认识

Dataset:创建可被Pytorch使用的数据集

提供一种方式获取数据及其label

Dataloader:向模型传递数据

为网络提供不同的数据形式

代码实战

蚂蚁蜜蜂/练手数据集:链接: https://pan.baidu.com/s/1jZoTmoFzaTLWh4lKBHVbEA 密码: 5suq

train为训练集,val为测试集,可以看到ants里蚂蚁的图片,bees里是蜜蜂的图片

复制代码
from torch.utils.data import Dataset
from PIL import Image
import os

class MyData(Dataset):
    def __init__(self, root_dir, label_dir):
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.path = os.path.join(self.root_dir, self.label_dir)
        # 函数是os模块中的一个重要函数,用于获取指定目录下的所有文件和子目录。
        self.image_path = os.listdir(self.path)

    def __getitem__(self, idx):
        img_name = self.image_path[idx]
        img_item_path = os.path.join(self.root_dir, self.label_dir,img_name)
        img = Image.open(img_item_path)
        label = self.label_dir
        return img, label

    def __len__(self):
        return len(self.image_path)

root_dir = "hymenoptera_data/train"
ants_label_dir = "ants"
bees_label_dir = "ants"
ants_dataset = MyData(root_dir, ants_label_dir)
bees_dataset = MyData(root_dir, bees_label_dir)
train_dataset = ants_dataset + bees_dataset
相关推荐
小咖自动剪辑1 分钟前
12306余票监控辅助工具详解:自动查询/多方案预约/到点提交
人工智能
得赢科技5 分钟前
智能菜谱研发公司推荐 适配中小型餐饮
大数据·运维·人工智能
一个无名的炼丹师9 分钟前
多模态RAG系统进阶:从零掌握olmOCR与MinerU的部署与应用
python·大模型·ocr·多模态·rag
victory043122 分钟前
Gradio实现中英文切换,不影响页面状态,不得刷新页面情况下
人工智能
u01092727123 分钟前
使用XGBoost赢得Kaggle比赛
jvm·数据库·python
MediaTea30 分钟前
<span class=“js_title_inner“>Python:实例对象</span>
开发语言·前端·javascript·python·ecmascript
微光闪现37 分钟前
践行“科技向善”,微乐播捐赠108,888元助力唇腭裂儿童绽放笑容
人工智能
闵帆1 小时前
反演学习器面临的鸿沟
人工智能·学习·机器学习
feasibility.1 小时前
多模态模型Qwen3-VL在Llama-Factory中断LoRA微调训练+测试+导出+部署全流程--以具身智能数据集open-eqa为例
人工智能·python·大模型·nlp·llama·多模态·具身智能
我需要一个支点1 小时前
douyin无水印视频下载
爬虫·python