【PyTorch笔记 05】使用DataLoader类进行数据加载的策略

文章目录

一、声明

  • 本帖持续更新中

二、情形1:同时加载不等长的两个数据

在某些情况下,训练数据的循环中需要同时加载两个数据集,然而加载两个数据集有可能不等长。这就有可能导致训练时出现逻辑问题。例如,小样本学习中需要加载支撑集和查询集,一个示例程序如下所示:

python 复制代码
# 用DataLoader类管理数据
support_loader   = DataLoader(support_dataset , batch_size=args.batch_size, shuffle=True)
query_loader  = DataLoader(query_dataset, batch_size=args.batch_size, shuffle=True)

# 训练循环
for (support_data, support_label, support_indices), (query_data, query_label, query_indices) in zip(support_loader, query_loader):        
        support_data, query_data = support_data.to(device).float(), query_data.to(device).float()
        query_label = query_label.to(device).long()

上述代码中,DataLoader类管理支撑集和查询集,当遇到不等长的情况时,循环会在短的数据处理结束时终止。

相关推荐
一切皆是因缘际会16 小时前
依托记忆结构心智体系,AI 自主意识进化路径
大数据·人工智能·安全·搜索引擎·ai
不是光头 强16 小时前
Java 后端实战进阶:从踩坑到架构的系统化笔记
java·笔记·架构
沪漂阿龙16 小时前
面试题详解:大模型设计沙箱全攻略——LLM Sandbox、Agent 工具执行、代码沙箱、安全隔离、权限控制与工程落地
网络·数据库·人工智能·安全
AI医影跨模态组学16 小时前
NPJ Precis Oncol(IF=8)南京医科大学第一附属医院放射肿瘤科等团队:整合MRI与ECV的放射组学模型提高高级别胶质瘤进展预测准确性
人工智能·深度学习·论文·医学影像·影像组学·医学科研
叶~小兮16 小时前
ELK技术栈全套学习笔记(Elasticsearch+Logstash+Filebeat)
笔记·学习·elk
超*16 小时前
Bright Data Web Scraping指南 2026: 使用 MCP + Dify 自动采集海外社交媒体数据
前端·人工智能·媒体
是店小二呀16 小时前
基于昇腾310P RC模式的Pi0模型部署实践
人工智能
洛宇16 小时前
(建议收藏)转型AI应用工程师之RAG:从入门到实战
前端·人工智能·面试
OpenBayes16 小时前
外语、方言、少数民族语言全覆盖:Hy-MT1.5 支持 1056 个翻译方向;MIT 联合发布 MathNet:涵盖 2.7 万道奥数真题的多模态数学推理基准
人工智能·深度学习·ai·agent
byzh_rc16 小时前
[自然语言处理-入门] 语音合成
人工智能·自然语言处理