📋 数据集概览
数据集名称:森林火灾检测数据集(Fire and Smoke Detection Dataset)
数据集用途:用于训练和评估森林火灾及烟雾检测的目标检测模型
🏷️ 类别信息
本数据集包含 2个检测类别:
| 类别ID | 类别名称 | 英文名称 | 说明 |
|---|---|---|---|
| 0 | 火灾 | Fire | 火焰目标 |
| 1 | 烟雾 | Smoke | 烟雾目标 |
📊 数据规模统计
数据集划分
| 数据集 | 图片数量 | 标注文件数量 | 占比 |
|---|---|---|---|
| 训练集 (train) | 6,900 张 | 6,900 个 | ~80.0% |
| 验证集 (val) | 862 张 | 862 个 | ~10.0% |
| 测试集 (test) | 863 张 | 863 个 | ~10.0% |
| 总计 | 8,625 张 | 8,625 个 | 100% |
数据特点
- ✅ 所有图片已统一尺寸为 640×640 像素
- ✅ 图片格式:JPG
- ✅ 支持单目标和多目标检测(一张图片可能同时包含Fire和Smoke)
- ✅ 提供多种标注格式(YOLO格式和XML格式)
📁 数据集目录结构
datasets/
├── images/ # 原始图片目录(8625张JPG图片)
├── txt/ # YOLO格式标注文件(8625个.txt文件)
├── xml/ # XML格式标注文件(8625个.xml文件,PASCAL VOC格式)
├── classes.txt # 类别名称文件
├── fire_smoke.yaml # YOLO数据集配置文件
├── best.pt # 训练好的模型权重文件
└── datasets/ # 划分后的数据集目录
├── train/ # 训练集
│ ├── images/ # 训练图片(6900张)
│ └── labels/ # 训练标注(6900个.txt文件)
├── val/ # 验证集
│ ├── images/ # 验证图片(862张)
│ └── labels/ # 验证标注(862个.txt文件)
└── test/ # 测试集
├── images/ # 测试图片(863张)
└── labels/ # 测试标注(863个.txt文件)
📝 标注格式说明
1. YOLO格式(.txt文件)
格式规范:
class_id x_center y_center width height
参数说明:
class_id: 类别ID(0=Fire, 1=Smoke)x_center: 边界框中心点x坐标(归一化到0-1)y_center: 边界框中心点y坐标(归一化到0-1)width: 边界框宽度(归一化到0-1)height: 边界框高度(归一化到0-1)
示例:
# 单个目标
0 0.5766 0.4562 0.6 0.3344
# 多个目标(每行一个目标)
0 0.85 0.4547 0.3031 0.225
1 0.4797 0.2469 0.4562 0.4906
2. XML格式(PASCAL VOC格式)
格式规范:标准的PASCAL VOC XML标注格式
示例:
<?xml version="1.0" encoding="utf-8"?>
<annotation>
<folder>MyDataset</folder>
<filename>1.jpg</filename>
<size>
<width>640</width>
<height>640</height>
<depth>3</depth>
</size>
<object>
<name>Fire</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>243</xmin>
<ymin>218</ymin>
<xmax>485</xmax>
<ymax>448</ymax>
</bndbox>
</object>
</annotation>
⚙️ 配置文件说明
fire_smoke.yaml
YOLO训练配置文件,包含以下信息:
# 数据集路径配置
path: D:\BaiduNetdiskDownload\1\datasets # 数据集根目录
train: train/images # 训练集图片路径(相对path)
val: val/images # 验证集图片路径(相对path)
# 类别数量
nc: 2
# 类别名称
names:
'0': Fire
'1': Smoke
🎯 使用场景
本数据集适用于以下应用场景:
-
森林火灾早期预警系统
- 实时监测森林区域
- 及时发现火灾和烟雾
-
环境监控系统
- 无人机巡检
- 固定摄像头监控
-
目标检测模型训练
- YOLO系列模型(YOLOv5, YOLOv8等)
- 其他深度学习目标检测框架
-
模型评估与对比
- 算法性能测试
- 模型精度评估
🔧 使用建议
训练前准备
-
检查数据完整性
- 确保每个图片都有对应的标注文件
- 验证标注格式是否正确
-
数据增强
- 建议使用数据增强技术提高模型泛化能力
- 常见增强:翻转、旋转、亮度调整等
-
类别平衡
- 检查Fire和Smoke类别的样本分布
- 必要时进行数据平衡处理
训练参数建议
- 输入尺寸:640×640(已统一)
- 批次大小:根据GPU显存调整(建议16-32)
- 学习率:初始学习率建议0.01
- 训练轮数:建议100-300 epochs
📈 数据集质量
- ✅ 所有图片已统一尺寸处理
- ✅ 标注格式标准化(YOLO + XML双格式)
- ✅ 数据集已按标准比例划分(8:1:1)
- ✅ 支持多目标检测场景
📄 相关文件
classes.txt: 类别名称列表fire_smoke.yaml: YOLO训练配置文件best.pt: 预训练模型权重(如可用)




