使用sklearn函数对模型进行交叉验证

使用sklearn函数对模型进行交叉验证

交叉验证用来做什么

交叉验证(Cross-Validatio),是用于在驯良过程中对训练模型的性能和参数进行评估选择的技术。

它的意义在于能够充分利用优先的数据集,减少数据分布不均匀以及随机性带来的模型评估误差。

交叉验证的作用就是将数据集分割成多个自己进行多次训练,每次训练的训练集与测试机不完全相同。

sklearn 中的函数

python 复制代码
from sklearn.model_selection import train_test_split, StratifiedKFold, KFold
skf = KFold(n_splits=10, random_state=233, shuffle=True)

n_splits:int, default=5

表示,要分割为多少个K子集

shuffle:bool, default=False

是否打乱数据

random_state:int or RandomState instance, default=None

随机状态,需要配合shuffle参数使用

参考文章 https://blog.csdn.net/weixin_43803950/article/details/120894868

python 复制代码
# 如果有额外的标签,train_path 标签数据,如果标签是跟随train_path,第二个可不填入
skf.split(train_path, train_path)
python 复制代码
   for fold_idx, (train_idx, val_idx) in enumerate(skf.split(train_path, train_path)):
        train_loader = torch.utils.data.DataLoader(
            XunFeiDataset(np.array(train_path)[train_idx],
                          A.Compose([
                              A.RandomRotate90(),
                              A.RandomCrop(120, 120),
                              A.HorizontalFlip(p=0.5),
                              A.RandomContrast(p=0.5),
                              A.RandomBrightnessContrast(p=0.5),
                          ])
                          ), batch_size=8, shuffle=True, num_workers=0, pin_memory=False
        )

        val_loader = torch.utils.data.DataLoader(
            XunFeiDataset(np.array(train_path)[val_idx],
                          A.Compose([
                              A.RandomCrop(120, 120),
                          ])
                          ), batch_size=8, shuffle=False, num_workers=0, pin_memory=False
        )

        for epoch_item in range(30):

            # adjust_learning_rate(optimizer, epoch_item)

            train_loss = train(train_loader, model, criterion, optimizer)

            val_acc = validate(val_loader, model, criterion)

            train_acc = validate(train_loader, model, criterion)

            print(train_loss, train_acc, val_acc)
相关推荐
星河天欲瞩21 小时前
【深度学习Day1】环境配置(CUDA、PyTorch)
人工智能·pytorch·python·深度学习·学习·机器学习·conda
盼小辉丶21 小时前
数据不再“拖后腿”,EasyLink重塑非结构化数据处理新范式
深度学习·大模型·多模态大模型
Liue6123123121 小时前
肝脏疾病病理特征识别与分类:基于GFL_R101-DConv-C3-C5_FPN_MS-2x_COCO模型的深度学习方法研究
深度学习·分类·数据挖掘
Liue6123123121 小时前
【深度学习】YOLO11-SlimNeck实现多种杂草植物叶片智能识别与分类系统,提升农业精准管理效率_2
人工智能·深度学习·分类
高洁0121 小时前
知识图谱如何结合 RAG实现更精确的知识问答
人工智能·算法·机器学习·数据挖掘·知识图谱
20130924162721 小时前
1957年罗森布拉特《感知机》报告深度剖析:人工智能的黎明与神经网络的奠基
人工智能·深度学习·神经网络
爱喝可乐的老王21 小时前
机器学习监督学习模型----KNN
人工智能·算法·机器学习
晨非辰21 小时前
C++波澜壮阔40年|类和对象篇:拷贝构造与赋值重载的演进与实现
运维·开发语言·c++·人工智能·后端·python·深度学习
(; ̄ェ ̄)。1 天前
机器学习入门(八)过拟合、欠拟合、L1、L2正则化
人工智能·机器学习
DARLING Zero two♡1 天前
几何直觉与概率流动的交响:深度解析《理解深度学习》的重构之美
人工智能·深度学习·重构