pytorch定义datase多次重复采样

有的时候训练需要对样本重复抽样为一个batch,可以按如下格式定义:

bash 复制代码
class TrainLoader(Dataset):
    def __init__(self, fns, repeat=1):
        super(TrainLoader, self).__init__()
        self.length = len(fns) # 数据数量
        self.repeat = repeat # 数据重复次数
    def __getitem__(self, idx):
        idx = idx % self.length 
    def __len__(self):
        return self.length * self.repeat           
相关推荐
IT_陈寒5 分钟前
Vue 3.4 性能优化揭秘:这5个Composition API技巧让我的应用提速40%
前端·人工智能·后端
Keep_Trying_Go8 分钟前
基于Transformer的目标统计方法(CounTR: Transformer-based Generalised Visual Counting)
人工智能·pytorch·python·深度学习·transformer·多模态·目标统计
小马爱打代码10 分钟前
Spring AI:RAG 增强检索介绍
java·人工智能·spring
yumgpkpm10 分钟前
接入Impala、Hive 的AI平台、开源大模型的国内厂商(星环、Doris、智谱AI、Qwen、DeepSeek、 腾讯混元、百川智能)
人工智能·hive·hadoop·zookeeper·spark·开源·hbase
视觉&物联智能10 分钟前
【杂谈】-音频深度伪造技术:识别与防范全攻略
人工智能·web安全·ai·aigc·音视频·agi
Mintopia12 分钟前
🤖 AI 时代,大模型与系统的可融合场景架构猜想
人工智能·前端框架·操作系统
jimmyleeee13 分钟前
人工智能基础知识笔记二十五:构建一个优化PDF简历的Agent
人工智能·笔记
阿正的梦工坊13 分钟前
τ-bench:重塑Agent评估的工具-代理-用户交互基准
人工智能·机器学习·大模型·llm
地中海~14 分钟前
LARGE LANGUAGE MODELS ARE NOT ROBUST ICLR2024
人工智能·笔记·nlp
2的n次方_14 分钟前
openEuler操作系统环境:目标检测软件开发实操与性能评估
人工智能·目标检测·计算机视觉