pytorch定义datase多次重复采样

有的时候训练需要对样本重复抽样为一个batch,可以按如下格式定义:

bash 复制代码
class TrainLoader(Dataset):
    def __init__(self, fns, repeat=1):
        super(TrainLoader, self).__init__()
        self.length = len(fns) # 数据数量
        self.repeat = repeat # 数据重复次数
    def __getitem__(self, idx):
        idx = idx % self.length 
    def __len__(self):
        return self.length * self.repeat           
相关推荐
程序员哈基耄8 分钟前
安全高效,本地运行:全能文件格式转换工具
大数据·python·安全
zuozewei10 分钟前
零基础 | AI应用记忆管理:从短期到长期的完整实践指南
运维·服务器·人工智能
数说星榆18112 分钟前
小型工厂工艺流程图制作_在线设计装配/焊接/冲压工艺流程模板
大数据·论文阅读·人工智能·流程图·论文笔记
老蒋每日coding18 分钟前
AI Agent 设计模式系列(十九)—— 评估和监控模式
人工智能·设计模式
AI浩21 分钟前
用于自动驾驶的ApolloScape数据集
人工智能·机器学习·自动驾驶
weixin_4215850128 分钟前
无监督配准
人工智能
救救孩子把30 分钟前
56-机器学习与大模型开发数学教程-5-3 最速下降法与动量法(Momentum)
人工智能·机器学习
njsgcs36 分钟前
MiniCPM4-0.5B-QAT-Int4-GPTQ-format 小显存llm
linux·人工智能
koo36437 分钟前
pytorch深度学习笔记18
pytorch·笔记·深度学习
Paul-LangJun41 分钟前
互信息和InfoNCE的关系
人工智能·对比学习·infonce·互信息