pytorch 数据载入

在PyTorch中,数据载入是训练深度学习模型的重要一环。

本文将介绍三种常用的数据载入方式:Dataset、DataLoader、以及自定义的数据加载器。

  1. 使用 Dataset 载入数据
    方法:

    from torch.utils.data import Dataset

    class CustomDataset(Dataset):
    def init(self, ...):
    # 初始化数据集
    # ...

    复制代码
     def __len__(self):
         # 返回数据集的大小
         return len(self.data)
    
     def __getitem__(self, idx):
         # 根据索引返回样本和标签
         return self.data[idx], self.labels[idx]

使用示例:

复制代码
custom_dataset = CustomDataset(...)
  1. 使用 DataLoader 加载数据集
    方法:

    from torch.utils.data import DataLoader

    data_loader = DataLoader(
    dataset,
    batch_size=32,
    shuffle=True,
    num_workers=4,
    drop_last=True,
    )

参数说明:

dataset: 要加载的数据集对象。

batch_size: 每个批次的样本数量。

shuffle: 是否在每个 epoch 开始时打乱数据。

num_workers: 用于数据加载的进程数。

drop_last: 是否丢弃最后一个不完整的批次。

使用示例:

复制代码
for data, labels in data_loader:
    # 训练模型的逻辑
  1. 使用自定义的 Data Loader
    方法:

    from torch.utils.data import DataLoader, IterableDataset

    class CustomDataLoader(IterableDataset):
    def init(self, ...):
    # 初始化数据加载器
    # ...

    复制代码
     def __iter__(self):
         # 返回一个迭代器
         return iter(self.data)

使用示例:

复制代码
custom_loader = CustomDataLoader(...)
for data in custom_loader:
    # 自定义数据处理逻辑

注意事项:

Dataset 和 DataLoader 是 PyTorch 提供的数据载入工具,通常能满足大多数情况。

自定义数据加载器 (IterableDataset) 可以用于特殊情况下的数据加载需求。

总结:

使用 Dataset 创建数据集对象,实现 lengetitem 方法。

使用 DataLoader 加载数据集,设置参数如 batch_size、shuffle 等。

可选地,使用自定义的数据加载器 (IterableDataset) 处理特殊情况下的数据载入需求。

相关推荐
ada7_6 小时前
LeetCode(python)39.组合总和
开发语言·数据结构·python·算法·leetcode·职场和发展
码农小白猿6 小时前
从数据到安全:IACheck如何优化场车碰撞事故记录的审核与风险识别
人工智能·安全·ai·自动化·iacheck
藦卡机器人6 小时前
安徽检测机器人品牌有哪些?
人工智能·机器人
2501_941805936 小时前
从边缘计算到智能代理的互联网系统演进实践与多语言实现分享全景技术思考与案例拆解录
人工智能·边缘计算
木昆子6 小时前
多智能体协作案例实践(一):基于AgentScope框架
人工智能·后端·python
木昆子6 小时前
多智能体协作案例实践(二):基于LangGraph框架
人工智能·后端·python
BBB努力学习程序设计6 小时前
Python异步编程:asyncio与async/await深度解析
python
ar01237 小时前
AR设备巡检,让数字化赋能运维标题】
人工智能·ar
线束线缆组件品替网7 小时前
SICK 传感器线缆现场信号稳定性工程实践解析
人工智能·数码相机·自动化·电脑·软件工程·智能电视
551只玄猫7 小时前
KNN算法手写数字识别 网格搜索 交叉验证 机器学习基础2 python人工智能
人工智能·python·算法·机器学习·knn·人工智能算法