【数据集 01】家庭室内烟火数据集(按比例划分训练、验证、测试)包含训练好的yolo11/yolov8模型

目录

1、数据来源

2、数据集分类

3、数据集统计

4、数据集结构

5、数据集配置文件

6、数据分割策略

7、数据预处理

8、数据集展示

9、YOLO11训练模型

9.1、模型评估

9.2、模型验证

9.3、模型测试

10、YOLOv8s训练模型

10.1、模型评估

10.2、模型验证

10.3、模型测试


1、数据来源

本项目通过搜集专门针对家庭室内火灾场景图像,经过专业标注和严格的质量控制,制作家庭烟火数据集。

2、数据集分类

类别ID 英文名称 中文名称 标注框个数
0 fire 2234
1 smoke 2285

3、数据集统计

数据集类型 图像数量 占比 用途
训练集(train) 2,420张 85% 模型训练
验证集(val) 285张 10% 模型验证
测试集(test) 142张 5% 性能评估
总计 2847张 100% -

4、数据集结构

复制代码
dataset/
├── train/
│   ├── images/
│   │   ├── fire_smoke_00001.jpg
│   │   └── ...
│   └── labels/
│       ├── fire_smoke_00001.txt
│       └── ...
├── valid/
│   ├── images/
│   └── labels/
└── test/
    ├── images/
    └── labels/

5、数据集配置文件

data.yaml

复制代码
train: D:/work/my/datasets/FireSmoke/train/images 
val: D:/work/my/datasets/FireSmoke/valid/images
test: D:/work/my/datasets/FireSmoke/test/images
 
nc: 2
names: ['fire', 'smoke']
 
labelfast:
  version: 1.3

路径使用绝对路径,如果训练自己的数据集可以改成自己的数据集路径。

6、数据分割策略

数据集采用科学的分割策略,确保训练、验证和测试集之间的数据分布均衡:

分割原则:

按比例分割:训练集85%,验证集10%,测试集5%

类别平衡:确保每个类别在各数据集中都有代表性样本

场景多样性:包含不同角度、不同光照条件下的图像

难度分布:从简单到复杂的检测场景都有涵盖

7、数据预处理

为了提高模型的训练效果和泛化能力,数据集经过了全面的预处理:

预处理步骤:

  • 图像标准化:统一图像尺寸640x640
  • 数据增强:通过旋转、翻转、缩放等方式增加数据多样性
  • 标注验证:检查标注文件的准确性和完整性
  • 质量筛选:移除模糊、损坏或标注错误的图像
  • 格式转换:转换为模型训练所需的格式

数据增强策略:

  • 几何变换:旋转、翻转、缩放、平移
  • 颜色变换:亮度、对比度、饱和度调整
  • 噪声添加:高斯噪声、椒盐噪声
  • 混合增强:Mosaic、MixUp等技术

8、数据集展示

部分训练图:

部分验证图:

部分测试图:

9、YOLO11训练模型

9.1、模型评估

模型评估分析

参数 类型 计算范围 实际含义 最后一轮值 表现 参考值(性能等级划分) 等级
train/box_loss 损失 所有训练样本 定位不准的平均代价 1.00366 持续下降至较低水平 优秀:< 0.8 良好:0.8--1.2 一般:1.2--1.8 较差:1.8--2.5 差:> 2.5 良好
train/cls_loss 损失 所有训练样本 分类错误的平均代价 0.64018 快速下降至很低水平 优秀:< 0.5 良好:0.5--1.0 一般:1.0--1.8 较差:1.8--3.0 差:> 3.0 良好
train/dfl_loss 损失 所有训练样本 坐标估计粗糙的代价 1.1355 平稳下降至较低水平 优秀:< 0.8 良好:0.8--1.2 一般:1.2--1.6 较差:1.6--2.0 差:> 2.0 良好
val/box_loss 损失 所有验证样本 泛化定位误差 1.70817 略高于训练损失,但整体稳定 同 train/box_loss(允许略高 0.2~0.4) 一般
val/cls_loss 损失 所有验证样本 泛化分类误差 1.05141 < 2.0 且整体稳定 同 train/cls_loss 良好
val/dfl_loss 损失 所有验证样本 泛化坐标误差 1.65726 与训练损失趋势基本一致 同 train/dfl_loss 较差
precision 指标 所有验证样本 整体查准率 0.81811 较高且稳定 优秀:≥ 0.85 良好:0.75--0.84 一般:0.60--0.74 较差:0.40--0.59 差:< 0.40 良好
recall 指标 所有验证样本 整体查全率 0.67807 中等水平 优秀:≥ 0.80 良好:0.70--0.79 一般:0.55--0.69 较差:0.35--0.54 差:< 0.35 一般
mAP@0.5 指标 每类 AP 平均 中等 IoU 下综合能力 0.7436 ≥ 0.7 顶尖:≥ 0.85 优秀:0.75--0.84 良好:0.65--0.74 可用:0.50--0.64 较差:0.30--0.49 差:< 0.30 优秀
mAP@[0.5:0.95] 指标 每类 AP@[0.5:0.95] 平均 严苛 IoU 下鲁棒性 0.40631 ≥ 0.4 顶尖:≥ 0.50 优秀:0.40--0.49 良好:0.30--0.39 一般:0.20--0.29 较差:0.10--0.19 差:< 0.10 优秀

9.2、模型验证

9.3、模型测试

10、YOLOv8s训练模型

10.1、模型评估

参数 类型 计算范围 实际含义 最后一轮值 表现 参考值(性能等级划分) 等级
train/box_loss 损失 所有训练样本 定位误差的平均代价 0.76342 持续下降至较低水平 优秀:< 0.8 良好:0.8--1.2 一般:1.2--1.8 较差:1.8--2.5 差:> 2.5 优秀
train/cls_loss 损失 所有训练样本 分类错误的平均代价 0.40745 快速下降至很低水平 优秀:< 0.5 良好:0.5--1.0 一般:1.0--1.8 较差:1.8--3.0 差:> 3.0 优秀
train/dfl_loss 损失 所有训练样本 坐标估计粗糙的代价 0.99324 平稳下降至较低水平 优秀:< 0.8 良好:0.8--1.2 一般:1.2--1.6 较差:1.6--2.0 差:> 2.0 良好
val/box_loss 损失 所有验证样本 泛化定位误差 1.66389 略高于训练损失,整体稳定 同 train/box_loss(允许略高 0.2~0.4) 一般
val/cls_loss 损失 所有验证样本 泛化分类误差 1.00054 < 2.0 且整体稳定 同 train/cls_loss 良好
val/dfl_loss 损失 所有验证样本 泛化坐标误差 1.67480 与训练损失趋势基本一致 同 train/dfl_loss 较差
precision (B) 指标 所有验证样本 整体查准率 0.84139 较高且稳定 优秀:≥ 0.85 良好:0.75--0.84 一般:0.60--0.74 较差:0.40--0.59 差:< 0.40 良好
recall (B) 指标 所有验证样本 整体查全率 0.68198 中等水平 优秀:≥ 0.80 良好:0.70--0.79 一般:0.55--0.69 较差:0.35--0.54 差:< 0.35 一般
mAP50 (B) 指标 每类 AP 平均 中等 IoU 下的综合检测能力 0.74964 ≥ 0.7,表现良好 顶尖:≥ 0.85 优秀:0.75--0.84 良好:0.65--0.74 可用:0.50--0.64 较差:0.30--0.49 差:< 0.30 优秀
mAP50-95 (B) 指标 每类 AP@[0.5:0.95] 平均 严苛 IoU 下的鲁棒性 0.43147 ≥ 0.4,表现良好 顶尖:≥ 0.50 优秀:0.40--0.49 良好:0.30--0.39 一般:0.20--0.29 较差:0.10--0.19 差:< 0.10 优秀

10.2、模型验证

10.3、模型测试

11、链接

|----------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 描述 | 链接 |
| 数据集链接 | 家庭室内烟火数据集(按比例划分训练、验证、测试)包含训练好的yolo11/yolov8模型 |
| 参考文件一 | 【深度学习02】YOLO模型的数据集、训练、验证、预测、导出-CSDN博客 |
| 匹配软件 | 【目标检测软件 03】基于yolo的室内烟火识别系统(含Python源码、UI界面、数据集、训练模型与代码-毕设推荐项目)-CSDN博客 |
| 往期回顾 ||
| 标注工具 | 【标注工具 01】labelfast标注工具使用指南(支持YOLO\COCO\VOC格式)-CSDN博客 |
| 通用版检测软件1 | 【目标检测软件 01】YOLO识别软件功能与操作指南_yolo软件-CSDN博客 |
| 通用版检测软件2 | 【目标检测软件 02】AirsPy 目标检测系统操作指南-CSDN博客 |

相关推荐
棒棒的皮皮16 小时前
【深度学习】YOLO模型精度优化 Checklist
人工智能·深度学习·yolo·计算机视觉
高洁0116 小时前
CLIP 的双编码器架构是如何优化图文关联的?(2)
python·深度学习·机器学习·知识图谱
koo36416 小时前
pytorch深度学习笔记9
pytorch·笔记·深度学习
拌面jiang16 小时前
过拟合--Overfitting(#拌面)
人工智能·深度学习·机器学习
Dev7z17 小时前
基于机器视觉与YOLO11的服装厂废料(边角料)分类检测系统(数据集+UI界面+训练代码+数据分析)
机器视觉·yolo11·服装厂废料·边角料·分类检测
haiyu_y17 小时前
Day 58 经典时序模型 2(ARIMA / 季节性 / 残差诊断)
人工智能·深度学习·ar
Stuomasi_xiaoxin18 小时前
ROS2介绍,及ubuntu22.04 安装ROS 2部署使用!
linux·人工智能·深度学习·ubuntu
李泽辉_18 小时前
深度学习算法学习(五):手动实现梯度计算、反向传播、优化器Adam
深度学习·学习·算法
李泽辉_18 小时前
深度学习算法学习(一):梯度下降法和最简单的深度学习核心原理代码
深度学习·学习·算法