pytorch定义datase多次重复采样

有的时候训练需要对样本重复抽样为一个batch,可以按如下格式定义:

bash 复制代码
class TrainLoader(Dataset):
    def __init__(self, fns, repeat=1):
        super(TrainLoader, self).__init__()
        self.length = len(fns) # 数据数量
        self.repeat = repeat # 数据重复次数
    def __getitem__(self, idx):
        idx = idx % self.length 
    def __len__(self):
        return self.length * self.repeat           
相关推荐
zzzzzz31012 小时前
DeepSeek-R1 蒸馏技术解密:如何用小模型超越 GPT-4?
人工智能
啥都鼓捣的小yao12 小时前
What is Prompt Engineering —— 提示词工程是什么?
人工智能·语言模型·prompt
爱钓鱼的程序员小郭12 小时前
阿里云自动配置安全组IP白名单
python·tcp/ip·安全·阿里云
ZWZhangYu12 小时前
【Gradio系列】使用 Gradio 快速构建机器学习图像分类实战
人工智能·机器学习·分类
大字明12 小时前
04 构建你的第一个 AI Agent
人工智能
梦醒过后说珍重12 小时前
PyTorch 工程实践:如何优雅地将 ViT 大模型封装为即插即用的感知损失(Perceptual Loss)
python·深度学习
溪饱鱼12 小时前
如何节省OpenClaw 80%的Token消耗
人工智能·aigc·ai编程
羽翼安全12 小时前
终端电脑视觉感知防拍屏软件 视觉感知防拍照软件
人工智能
霖大侠12 小时前
Towards Generalizable Scene Change Detection
人工智能·深度学习·机器学习
超越自我肖12 小时前
python--函数返回值之None类型
python