智慧工地刚需!安全帽佩戴检测数据集开源

智慧工地刚需!安全帽佩戴检测数据集开源

导语:

工地安全无小事,安全帽是最后一道防线。

传统人工巡检效率低、盲区多,而基于计算机视觉的自动安全帽佩戴检测 ,正成为智慧工地的标配能力。

今天为大家带来开源数据集------SHWD(Safety Helmet Wearing Dataset),源自 Smart Construction 项目,专为 YOLO 系列打造,助力快速落地工地安全管控系统。


01 数据集背景

在建筑、厂房、道路维修等高风险作业场景中,未佩戴安全帽 是导致头部伤害的主要原因之一。

传统依赖人工巡查的方式存在:

  • 监管覆盖不全
  • 实时性差
  • 人力成本高

SHWD 数据集正是为解决上述问题而生,旨在通过高质量数据与开源工具链,降低安全帽检测算法的研发门槛,推动智慧工地建设。


02 数据集概览

项目 详情
数据集名称 SHWD(安全帽佩戴检测数据集)
数据规模 7,581 张图像
标注对象 ✅ 佩戴安全帽:9,044 个 ❌ 未佩戴安全帽:111,514 个
数据来源 Google、Baidu 搜索引擎(真实场景采集)
标注工具 LabelImg(人工精细标注)
适用场景 工地、厂房、道路施工、智慧园区

💡 数据特点:负样本(未佩戴)数量显著多于正样本,更符合真实工地"多数违规、少数规范"的分布规律,利于模型学习违规特征。


03 数据集结构(VOC/YOLO双格式)

数据集采用 Pascal VOC 标准格式标注,并同步提供 YOLO 格式文件,开箱即用。

text 复制代码
SHWD/
├── Annotations/   # Pascal VOC 格式标注(XML)
├── images/        # 原始图像(JPG)
├── labels/        # YOLO 格式标注(TXT)
└── data.yaml      # 数据集配置文件

📂 关键目录说明

  • Annotations:存放 XML 标注文件,包含目标类别、边界框坐标等元信息
  • images:存放 JPG 格式的原始图像
  • labels :存放 YOLO 格式 TXT 文件(每行:class_id x_center y_center width height
  • data.yaml:数据集核心配置文件,定义类别名称与数据路径

📊 数据划分

数据集已预先划分为:

  • 训练集:用于模型参数学习
  • 验证集:用于超参数调优与早停
  • 测试集:用于最终性能评估

04 应用场景

🔸 智慧工地监控 :实时检测工人安全帽佩戴情况,自动预警违规行为

🔸 安全生产巡检 :替代人工巡查,提升隐患排查效率

🔸 智慧城市治理 :扩展至厂区、矿区、道路施工等多元场景

🔸 算法研究验证:作为目标检测(尤其是小目标/遮挡场景)的基准数据集

实际落地中,可联动声光报警器、短信推送等机制,实现"检测-预警-处置"闭环管理。


05 快速上手(YOLOv5/v8/v10/v11/v26 训练示例)

① 准备环境

bash 复制代码
git clone https://github.com/ultralytics/yolov5  # 或 yolov8
cd yolov5
pip install -r requirements.txt

② 配置文件说明(data.yaml)

yaml 复制代码
# SHWD 数据集配置
path: ./SHWD
train: images/train
val: images/val

# 类别定义(0=佩戴,1=未佩戴)
names:
  0: helmet_on    # 佩戴安全帽
  1: helmet_off   # 未佩戴安全帽

③ 启动训练

bash 复制代码
# YOLOv5 训练示例
python train.py --img 640 --batch 16 --epochs 100 --data data.yaml --weights yolov5s.pt

# YOLOv8 训练示例
yolo train model=yolov8s.pt data=data.yaml epochs=100 imgsz=640

④ 模型推理

bash 复制代码
# 单张图像检测
yolo predict model=best.pt source=test.jpg

# 视频流检测
yolo predict model=best.pt source=construction.mp4

06 获取方式

📥 下载地址

数据集已托管至云服务器,方便国内用户下载。

后台回复关键词:安全帽检测

即可获取 百度网盘下载链接