pytorch定义datase多次重复采样

有的时候训练需要对样本重复抽样为一个batch,可以按如下格式定义:

bash 复制代码
class TrainLoader(Dataset):
    def __init__(self, fns, repeat=1):
        super(TrainLoader, self).__init__()
        self.length = len(fns) # 数据数量
        self.repeat = repeat # 数据重复次数
    def __getitem__(self, idx):
        idx = idx % self.length 
    def __len__(self):
        return self.length * self.repeat           
相关推荐
爱喝可乐的老王1 分钟前
深度学习初认识
人工智能·深度学习
前端达人2 分钟前
为什么聪明的工程师都在用TypeScript写AI辅助代码?
前端·javascript·人工智能·typescript·ecmascript
AI科技星8 分钟前
张祥前统一场论的数学表述与概念梳理:从几何公设到统一场方程
人工智能·线性代数·算法·机器学习·矩阵·数据挖掘
丝斯201110 分钟前
AI学习笔记整理(55)——大模型训练流程
人工智能·笔记·学习
GatiArt雷17 分钟前
生成式AI重构开发流程:从工具到生产力的质变之路
人工智能
迎仔22 分钟前
算力中心设备指南 (1):计算单元——从“全能经理”到“暴力施工队”
人工智能
程序员泠零澪回家种桔子28 分钟前
MCP架构核心组件
人工智能·ai·架构
来两个炸鸡腿33 分钟前
【Datawhale组队学习202601】Base-NLP task04 参数高效微调
人工智能·学习·自然语言处理
YH12312359h34 分钟前
YOLO11-LSKNet钢材表面缺陷检测与分类系统详解
人工智能·分类·数据挖掘
理智.62935 分钟前
Cursor 中使用 Conda 虚拟环境常见问题与彻底解决方案(踩坑实录)
python·conda