智慧工地刚需!安全帽佩戴检测数据集开源
导语:
工地安全无小事,安全帽是最后一道防线。
传统人工巡检效率低、盲区多,而基于计算机视觉的自动安全帽佩戴检测 ,正成为智慧工地的标配能力。
今天为大家带来开源数据集------SHWD(Safety Helmet Wearing Dataset),源自 Smart Construction 项目,专为 YOLO 系列打造,助力快速落地工地安全管控系统。
01 数据集背景
在建筑、厂房、道路维修等高风险作业场景中,未佩戴安全帽 是导致头部伤害的主要原因之一。
传统依赖人工巡查的方式存在:
- 监管覆盖不全
- 实时性差
- 人力成本高
SHWD 数据集正是为解决上述问题而生,旨在通过高质量数据与开源工具链,降低安全帽检测算法的研发门槛,推动智慧工地建设。
02 数据集概览
| 项目 | 详情 |
|---|---|
| 数据集名称 | SHWD(安全帽佩戴检测数据集) |
| 数据规模 | 7,581 张图像 |
| 标注对象 | ✅ 佩戴安全帽:9,044 个 ❌ 未佩戴安全帽:111,514 个 |
| 数据来源 | Google、Baidu 搜索引擎(真实场景采集) |
| 标注工具 | LabelImg(人工精细标注) |
| 适用场景 | 工地、厂房、道路施工、智慧园区 |
💡 数据特点:负样本(未佩戴)数量显著多于正样本,更符合真实工地"多数违规、少数规范"的分布规律,利于模型学习违规特征。
03 数据集结构(VOC/YOLO双格式)
数据集采用 Pascal VOC 标准格式标注,并同步提供 YOLO 格式文件,开箱即用。
text
SHWD/
├── Annotations/ # Pascal VOC 格式标注(XML)
├── images/ # 原始图像(JPG)
├── labels/ # YOLO 格式标注(TXT)
└── data.yaml # 数据集配置文件


📂 关键目录说明
- Annotations:存放 XML 标注文件,包含目标类别、边界框坐标等元信息
- images:存放 JPG 格式的原始图像
- labels :存放 YOLO 格式 TXT 文件(每行:
class_id x_center y_center width height) - data.yaml:数据集核心配置文件,定义类别名称与数据路径
📊 数据划分
数据集已预先划分为:
- 训练集:用于模型参数学习
- 验证集:用于超参数调优与早停
- 测试集:用于最终性能评估
04 应用场景
🔸 智慧工地监控 :实时检测工人安全帽佩戴情况,自动预警违规行为
🔸 安全生产巡检 :替代人工巡查,提升隐患排查效率
🔸 智慧城市治理 :扩展至厂区、矿区、道路施工等多元场景
🔸 算法研究验证:作为目标检测(尤其是小目标/遮挡场景)的基准数据集
实际落地中,可联动声光报警器、短信推送等机制,实现"检测-预警-处置"闭环管理。
05 快速上手(YOLOv5/v8/v10/v11/v26 训练示例)
① 准备环境
bash
git clone https://github.com/ultralytics/yolov5 # 或 yolov8
cd yolov5
pip install -r requirements.txt
② 配置文件说明(data.yaml)
yaml
# SHWD 数据集配置
path: ./SHWD
train: images/train
val: images/val
# 类别定义(0=佩戴,1=未佩戴)
names:
0: helmet_on # 佩戴安全帽
1: helmet_off # 未佩戴安全帽
③ 启动训练
bash
# YOLOv5 训练示例
python train.py --img 640 --batch 16 --epochs 100 --data data.yaml --weights yolov5s.pt
# YOLOv8 训练示例
yolo train model=yolov8s.pt data=data.yaml epochs=100 imgsz=640
④ 模型推理
bash
# 单张图像检测
yolo predict model=best.pt source=test.jpg
# 视频流检测
yolo predict model=best.pt source=construction.mp4
06 获取方式
📥 下载地址 :
数据集已托管至云服务器,方便国内用户下载。
后台回复关键词:安全帽检测
即可获取 百度网盘下载链接。