【PyTorch笔记 05】使用DataLoader类进行数据加载的策略

文章目录

一、声明

  • 本帖持续更新中

二、情形1:同时加载不等长的两个数据

在某些情况下,训练数据的循环中需要同时加载两个数据集,然而加载两个数据集有可能不等长。这就有可能导致训练时出现逻辑问题。例如,小样本学习中需要加载支撑集和查询集,一个示例程序如下所示:

python 复制代码
# 用DataLoader类管理数据
support_loader   = DataLoader(support_dataset , batch_size=args.batch_size, shuffle=True)
query_loader  = DataLoader(query_dataset, batch_size=args.batch_size, shuffle=True)

# 训练循环
for (support_data, support_label, support_indices), (query_data, query_label, query_indices) in zip(support_loader, query_loader):        
        support_data, query_data = support_data.to(device).float(), query_data.to(device).float()
        query_label = query_label.to(device).long()

上述代码中,DataLoader类管理支撑集和查询集,当遇到不等长的情况时,循环会在短的数据处理结束时终止。

相关推荐
oo哦哦3 分钟前
2026年矩阵管理工具全景观察:从项目协作到全域运营,工具进化的下一站在哪里?
人工智能·矩阵·重构
ting94520003 分钟前
专用 ASIC 推理云平台:面向通用计算场景的 GPU 训练架构替代方案深度技术解析
人工智能·架构
KTJT0064 分钟前
中小企业营销的“双轮驱动”:IP矩阵 + GEO如何实现1+1>2
大数据·人工智能
枫叶林FYL4 分钟前
【强化学习】6 MoE-GRPO:视觉语言模型中基于强化学习的混合专家路由优化
人工智能·语言模型·php
程序员雷欧4 分钟前
多Agent编排模块深度解析
笔记
青云计划5 分钟前
SSE流式响应:从Reactor Flux到生产级AI聊天的工程实践——5分钟超时、线程隔离、背压处理全解析
前端·人工智能·firefox
老马识途2.07 分钟前
COZE学习及总结
人工智能
数智化精益手记局8 分钟前
仓库管理软件核心功能拆解:企业如何利用仓库管理软件解决库存积压与错发难题
大数据·人工智能·云计算
阿拉伯柠檬11 分钟前
大语言模型 LLM
人工智能·python·语言模型·自然语言处理·langchain
灰灰勇闯IT11 分钟前
MQA:全部 Query 共享一套 Key-Value
人工智能·深度学习·机器学习