PyTorch的dataloader制作自定义数据集

PyTorch的dataloader是用于读取训练数据的工具,它可以自动将数据分割成小batch,并在训练过程中进行数据预处理。以下是制作PyTorch的dataloader的简单步骤:

  1. 导入必要的库

    import torch
    from torch.utils.data import DataLoader, Dataset

  2. 定义数据集类 需要自定义一个继承自torch.utils.data.Dataset的类,在该类中实现__len____getitem__方法。

    class MyDataset(Dataset):
    def init(self, data):
    self.data = data

    复制代码
     def __len__(self):
         return len(self.data)
     
     def __getitem__(self, index):
         # 返回第index个数据样本
         return self.data[index]
  3. 创建数据集实例

    data = [1, 2, 3, 4, 5]
    dataset = MyDataset(data)

  4. 创建dataloader实例

使用torch.utils.data.DataLoader创建dataloader实例,可以设置batch_sizeshuffle等参数。

复制代码
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)
  1. 使用dataloader读取数据

    for batch in dataloader:
    # batch为一个batch的数据,可以直接用于训练
    print(batch)

以上是制作PyTorch的dataloader的简单步骤,根据实际需求可以进行更复杂的操作,如数据增强、并行读取等。

5.已经分类的文件生成标注文件

假设你已经将所有的图片按照类别分别放到了十个文件夹中,可以使用以下代码生成标注文件:

复制代码
import os
# 定义图片所在的文件夹路径和标注文件的路径
img_dir = '/path/to/image/directory'
ann_file = '/path/to/annotation/file.txt'
# 遍历每个类别文件夹中的图片,将标注信息写入到标注文件中
with open(ann_file, 'w') as f:
    for class_id in range(1, 11):
        class_dir = os.path.join(img_dir, 'class{}'.format(class_id))
        for filename in os.listdir(class_dir):
            if filename.endswith('.jpg'):
                # 写入图片的文件名和类别
                f.write('{} {}\n'.format(filename, class_id))
相关推荐
Q_Q196328847514 小时前
python+spring boot洪涝灾害应急信息管理系统 灾情上报 预警发布 应急资源调度 灾情图表展示系统
开发语言·spring boot·python·django·flask·node.js·php
IT古董15 小时前
【第五章:计算机视觉-项目实战之图像分割实战】1.图像分割理论-(2)图像分割衍生:语义分割、实例分割、弱监督语义分割
人工智能·计算机视觉
pop_opo_15 小时前
使用 Python + Pygame 键盘控制无人机(AirSim)
python·无人机·pygame
程序猿老罗16 小时前
使用Python轻松实现Word到PDF的批量转换
python·pdf·word
大明者省16 小时前
《青花》歌曲,使用3D表现出意境
人工智能
一朵小红花HH17 小时前
SimpleBEV:改进的激光雷达-摄像头融合架构用于三维目标检测
论文阅读·人工智能·深度学习·目标检测·机器学习·计算机视觉·3d
Daitu_Adam17 小时前
R语言——ggmap包可视化地图
人工智能·数据分析·r语言·数据可视化
weixin_3776348417 小时前
【阿里DeepResearch】写作组件WebWeaver详解
人工智能
AndrewHZ17 小时前
【AI算力系统设计分析】1000PetaOps 算力云计算系统设计方案(大模型训练推理专项版)
人工智能·深度学习·llm·云计算·模型部署·大模型推理·算力平台
AI_gurubar17 小时前
[NeurIPS‘25] AI infra / ML sys 论文(解析)合集
人工智能