pytorch定义datase多次重复采样

有的时候训练需要对样本重复抽样为一个batch,可以按如下格式定义:

bash 复制代码
class TrainLoader(Dataset):
    def __init__(self, fns, repeat=1):
        super(TrainLoader, self).__init__()
        self.length = len(fns) # 数据数量
        self.repeat = repeat # 数据重复次数
    def __getitem__(self, idx):
        idx = idx % self.length 
    def __len__(self):
        return self.length * self.repeat           
相关推荐
dog2502 分钟前
圆锥曲线和二次曲线
开发语言·网络·人工智能·算法·php
岛雨QA3 分钟前
🎉Token自由-Ollama部署本地大模型超详细操作指南
人工智能·llm·ollama
云游6 分钟前
从“人工打补丁”到“自主进化”:多轮对话文本转SQL智能体的技术跃迁
人工智能·文本转sql
区块block11 分钟前
Infinity Alpha(无限阿尔法)即将发布纯链上AI收益引擎通证IA
人工智能·区块链
有为少年11 分钟前
从概率估计到“LLM 训练是有损压缩”
人工智能·线性代数·机器学习·计算机视觉·矩阵
迦南的迦 亚索的索13 分钟前
AI_10_Coze_Multi-Agent多智能体
人工智能
:mnong17 分钟前
理解 AI 时代的软件范式
人工智能·log4j
小飞象—木兮18 分钟前
《销售数据分析标准实践手册》:核心内涵与关键指标、落地销售数据分析的全流程···(附相关材料下载)
大数据·人工智能·数据挖掘·数据分析
爱学习的张大40 分钟前
具身智能论文问答(三):Open VLA
人工智能·算法
架构源启40 分钟前
OpenClaw 只能手动写脚本?我用 Chrome 插件实现了“录制即生成“
前端·人工智能·chrome·自动化