Pytorch:torch.utils.data.random_split()

random_split() 函数说明:

torch.utils.data.random_split(dataset, lengths, generator=<torch._C.Generator object>)

参数:

  • dataset(Dataset) -要拆分的数据集
  • lengths(序列) -要产生的分割长度
  • generator(torch.Generator) -用于随机排列的生成器。

注:关于torch.Generator详见笔记:Pytorch:torch.Generator()

pytorch: random_split(),函数的具体定义如下:

python 复制代码
def random_split(dataset, lengths):
    r"""
    Randomly split a dataset into non-overlapping new datasets of given lengths.

    Arguments:
        dataset (Dataset): Dataset to be split
        lengths (sequence): lengths of splits to be produced
    """
    if sum(lengths) != len(dataset):
        raise ValueError("Sum of input lengths does not equal the length of the input dataset!")

    indices = randperm(sum(lengths)).tolist()
    return [Subset(dataset, indices[offset - length:offset]) for offset, length in zip(_accumulate(lengths), lengths)]

以U-Net代码(详见:U-Net代码复现)为例:

python 复制代码
n_val = int(len(dataset) * val_percent)
n_train = len(dataset) - n_val
train_set, val_set = random_split(dataset, [n_train, n_val], generator=torch.Generator().manual_seed(0))

通过random_split()将数据分为训练集和验证集(随机)

相关推荐
weixin_444012935 小时前
SQL处理大规模分组聚合的内存限制_调整服务器配置.txt
jvm·数据库·python
Joseph Cooper5 小时前
生产级 AI Agent 评估体系:从 12 指标框架到持续评估闭环
人工智能·ai·agent·eval·harness
桂花很香,旭很美5 小时前
有不 delay 的 AI 项目吗?
人工智能·项目管理·agent
爱写代码的小朋友5 小时前
人工智能背景下深度学习在高中信息技术教育中的应用研究
人工智能·深度学习
knight_9___5 小时前
大模型project面试5
人工智能·python·深度学习·面试·agent·rag·mcp
东方佑5 小时前
OpenASH 85M 参数,不用 Softmax,也能通过中文考试
人工智能·深度学习
剑客自媒体5 小时前
社保卡照片怎么用手机上传?尺寸和背景色有什么要求?
python·智能手机
nujnewnehc5 小时前
第一次接触 agent 概念分享
人工智能·llm·agent
怪祝浙5 小时前
AI实战之地dify应用-nlp数据库查询agent助手的搭建与发布
人工智能
2301_780943845 小时前
第五阶段:高级主题
人工智能