pytorch定义datase多次重复采样

有的时候训练需要对样本重复抽样为一个batch,可以按如下格式定义:

bash 复制代码
class TrainLoader(Dataset):
    def __init__(self, fns, repeat=1):
        super(TrainLoader, self).__init__()
        self.length = len(fns) # 数据数量
        self.repeat = repeat # 数据重复次数
    def __getitem__(self, idx):
        idx = idx % self.length 
    def __len__(self):
        return self.length * self.repeat           
相关推荐
YUNDUANNET10 小时前
AI驱动,不止于概念 | VeryCloud联合亚马逊云科技深度解读OpenClaw开发范式革命
人工智能·科技·openclaw
热爱生活的猴子10 小时前
什么情况是训练好验证差,什么情况判定为收敛慢,什么情况下判定为震荡,什么情况下说明是泛化差
人工智能·深度学习·机器学习
ggabb10 小时前
以色列的科技实力与全球格局分析
大数据·人工智能
吴佳浩10 小时前
Claude Code 源码泄露事件深度剖析
人工智能·npm·agent
智算菩萨10 小时前
【论文精读】AI-assisted rational decision-making:AI 如何辅助理性决策?
论文阅读·人工智能·论文笔记
Bert.Cai10 小时前
Python字面量详解
开发语言·python
Flying pigs~~10 小时前
基于Deepseek大模型API完成文本分类预测功能
java·前端·人工智能·python·langchain·deepseek
饼干哥哥10 小时前
怎么写好一个AI提示词?10个场景与50个技巧+官方100个教程合集
人工智能
. . . . .11 小时前
git-ai 项目详解
人工智能·git
白狐_79811 小时前
深度解析:大语言模型(LLM)联网搜索与实时数据获取的底层原理
人工智能·语言模型·自然语言处理