pytorch定义datase多次重复采样

有的时候训练需要对样本重复抽样为一个batch,可以按如下格式定义:

bash 复制代码
class TrainLoader(Dataset):
    def __init__(self, fns, repeat=1):
        super(TrainLoader, self).__init__()
        self.length = len(fns) # 数据数量
        self.repeat = repeat # 数据重复次数
    def __getitem__(self, idx):
        idx = idx % self.length 
    def __len__(self):
        return self.length * self.repeat           
相关推荐
ZzzZ314159268 分钟前
【无标题】
人工智能
Hcoco_me11 分钟前
大模型面试题19:梯度消失&梯度爆炸 纯白话文版
人工智能·rnn·深度学习·自然语言处理·word2vec
哈__11 分钟前
CodeLlama与昇腾NPU的实践之旅
人工智能·gitcode·sglang
GMICLOUD26 分钟前
GMI Cloud@AI周报 | MiniMax 叩响港股大门;智谱 GLM-4.7 开源
人工智能·ai资讯
0x000731 分钟前
进击的智谱 - GLM 4.7 双旦大礼
人工智能
_codemonster39 分钟前
AI大模型入门到实战系列--使用Pytorch实现transformer文本分类
人工智能·pytorch·transformer
Elastic 中国社区官方博客1 小时前
Elasticsearch:在 X-mas 吃一些更健康的东西
android·大数据·数据库·人工智能·elasticsearch·搜索引擎·全文检索
DKHZ_OfficeAI1 小时前
开启AI办公新时代:Office+WPS双平台智能助手全面赋能
人工智能
Coder_Boy_1 小时前
基于SpringAI的智能平台基座开发-(四)
java·人工智能·spring boot·langchain·springai
我不爱机器学习1 小时前
使用 PyTorch 进行分布式计算
pytorch