深度学习(YOLO、DETR) 十折交叉验证

二:交叉验证

在 K 折验证之前最常用的验证方法就是交叉验证,即把数据划分为训练集、验证集和测试集。一般的划分比例为 7:1:2。但如何合理的抽取样本就成为了使用交叉验证的难点,不同的抽取方法会导致截然不同的训练性能。同时由于验证机和训练集是不参与训练的,导致大量的数据无法应用于学习,所以显而易见的会导致训练的效果下降。

二:K 折交叉验证

将训练集数据划分为 K 部分,利用其中的 K-1 份做为训练,剩余的一份作为测试,最后取平均测试误差做为泛化误差。这样做的好处是,训练集的所有样本都必然会成为训练数据同时页必然有机会成为一次测试集。可以更好的利用训练集数据。

K 越大,平均误差被视为泛化误差这个结果就越可靠,但相应的所花费的时间也是线性增长的。

上图 中 划分测试、训练、验证的时候 平均分成10份 7份训练 1份验证 2份测试 。

按照顺序循环成一个圈 代码如下:

python 复制代码
import os
import shutil
import numpy as np

#文件地址
postfix = 'jpg'
imgpath = 'D:\\dataset\\images'
txtpath = 'D:\\dataset\\txt'


# 创建存储交叉验证结果的基础目录
os.makedirs('cross_validation', exist_ok=True)

# 获取文件列表并按文件名排序
listdir = np.array(sorted([i for i in os.listdir(txtpath) if i.endswith('.txt')], key=lambda x: int(x[:-4])))

# 将文件列表等分为10份
folds = np.array_split(listdir, 10)

# 进行10次交叉验证
for fold in range(10):
    # 初始化训练、验证、测试集索引
    train_indices = []
    val_indices = []
    test_indices = []

    # 训练集索引
    for i in range(7):
        index = (fold + i) % 10
        train_indices.extend(folds[index])

    # 验证集索引
    val_index = (fold + 7) % 10
    val_indices.extend(folds[val_index])

    # 测试集索引
    test_indices.extend(folds[(fold + 8) % 10])
    test_indices.extend(folds[(fold + 9) % 10])

    # 打印每次折的训练集、验证集和测试集的大小
    print(f'Fold {fold + 1}:')
    print(f'  Train set size: {len(train_indices)}')
    print(f'  Validation set size: {len(val_indices)}')
    print(f'  Test set size: {len(test_indices)}')

    # 为当前折创建目录
    fold_dir = f'cross_validation/fold_{fold + 1}'
    os.makedirs(f'{fold_dir}/images/train', exist_ok=True)
    os.makedirs(f'{fold_dir}/images/val', exist_ok=True)
    os.makedirs(f'{fold_dir}/images/test', exist_ok=True)
    os.makedirs(f'{fold_dir}/labels/train', exist_ok=True)
    os.makedirs(f'{fold_dir}/labels/val', exist_ok=True)
    os.makedirs(f'{fold_dir}/labels/test', exist_ok=True)

    # 将文件复制到当前折的训练、验证和测试目录中
    for i in train_indices:
        img_file = f'{imgpath}/{i[:-4]}.jpg'
        lbl_file = f'{txtpath}/{i}'
        shutil.copy(img_file, f'{fold_dir}/images/train/{i[:-4]}.jpg')
        shutil.copy(lbl_file, f'{fold_dir}/labels/train/{i}')

    for i in val_indices:
        img_file = f'{imgpath}/{i[:-4]}.jpg'
        lbl_file = f'{txtpath}/{i}'
        shutil.copy(img_file, f'{fold_dir}/images/val/{i[:-4]}.jpg')
        shutil.copy(lbl_file, f'{fold_dir}/labels/val/{i}')

    for i in test_indices:
        img_file = f'{imgpath}/{i[:-4]}.jpg'
        lbl_file = f'{txtpath}/{i}'
        shutil.copy(img_file, f'{fold_dir}/images/test/{i[:-4]}.jpg')
        shutil.copy(lbl_file, f'{fold_dir}/labels/test/{i}')

images和txt文件夹下存放文件,没有任何子文件夹

相关推荐
石工记4 分钟前
OpenClaw AI 助手 Docker Compose 一键部署文档(可下载)
人工智能·docker·容器
格林威5 分钟前
Halcon vs OpenCV 速度对比(表格)
人工智能·数码相机·opencv·机器学习·计算机视觉·视觉检测·halcon
WwW.-.8 分钟前
OpenClaw 技术解析:多渠道 AI Gateway 如何连接消息、Agent 与远程节点
网络·人工智能·gateway
不如语冰9 分钟前
openclaw安装使用教程,飞书配置,skills简介
人工智能·飞书·skills·openclaw
雷焰财经12 分钟前
智能合约赋能与全球实践:宇信科技绘制银行数字人民币能力建设新蓝图
人工智能·科技·金融·智能合约
一去不复返的通信er12 分钟前
生成对抗网络(GAN)
深度学习·机器学习·生成对抗网络
飞Link12 分钟前
终结序列建模:Transformer 架构深度解析与实战指南
人工智能·python·深度学习·算法·transformer
青瓷程序设计13 分钟前
基于深度学习的【动物识别】系统实现~Python+人工智能+图像识别+算法模型
人工智能·python·深度学习
AC赳赳老秦14 分钟前
2026 AI原生工具链升级:DeepSeek与AI原生IDE深度联动,重塑开发效率新高度
大数据·ide·人工智能·web3·去中心化·ai-native·deepseek
virtaitech15 分钟前
GPU池化技术走向大众:趋动科技推出永久免费OrionX社区版
人工智能·科技·gpu算力·算力·云平台