智慧工地刚需！安全帽佩戴检测数据集开源

导语：

工地安全无小事，安全帽是最后一道防线。

传统人工巡检效率低、盲区多，而基于计算机视觉的自动安全帽佩戴检测 ，正成为智慧工地的标配能力。

今天为大家带来开源数据集------SHWD（Safety Helmet Wearing Dataset），源自 Smart Construction 项目，专为 YOLO 系列打造，助力快速落地工地安全管控系统。

01 数据集背景

在建筑、厂房、道路维修等高风险作业场景中，未佩戴安全帽 是导致头部伤害的主要原因之一。

传统依赖人工巡查的方式存在：

监管覆盖不全
实时性差
人力成本高

SHWD 数据集正是为解决上述问题而生，旨在通过高质量数据与开源工具链，降低安全帽检测算法的研发门槛，推动智慧工地建设。

02 数据集概览

项目	详情
数据集名称	SHWD（安全帽佩戴检测数据集）
数据规模	7,581 张图像
标注对象	✅ 佩戴安全帽：9,044 个 ❌ 未佩戴安全帽：111,514 个
数据来源	Google、Baidu 搜索引擎（真实场景采集）
标注工具	LabelImg（人工精细标注）
适用场景	工地、厂房、道路施工、智慧园区

💡 数据特点：负样本（未佩戴）数量显著多于正样本，更符合真实工地"多数违规、少数规范"的分布规律，利于模型学习违规特征。

03 数据集结构（VOC/YOLO双格式）

数据集采用 Pascal VOC 标准格式标注，并同步提供 YOLO 格式文件，开箱即用。

text 复制代码

SHWD/
├── Annotations/   # Pascal VOC 格式标注（XML）
├── images/        # 原始图像（JPG）
├── labels/        # YOLO 格式标注（TXT）
└── data.yaml      # 数据集配置文件

📂 关键目录说明

Annotations：存放 XML 标注文件，包含目标类别、边界框坐标等元信息
images：存放 JPG 格式的原始图像
labels ：存放 YOLO 格式 TXT 文件（每行：class_id x_center y_center width height）
data.yaml：数据集核心配置文件，定义类别名称与数据路径

📊 数据划分

数据集已预先划分为：

训练集：用于模型参数学习
验证集：用于超参数调优与早停
测试集：用于最终性能评估

04 应用场景

🔸 智慧工地监控 ：实时检测工人安全帽佩戴情况，自动预警违规行为

🔸 安全生产巡检 ：替代人工巡查，提升隐患排查效率

🔸 智慧城市治理 ：扩展至厂区、矿区、道路施工等多元场景

🔸 算法研究验证：作为目标检测（尤其是小目标/遮挡场景）的基准数据集

实际落地中，可联动声光报警器、短信推送等机制，实现"检测-预警-处置"闭环管理。

05 快速上手（YOLOv5/v8/v10/v11/v26 训练示例）

① 准备环境

bash 复制代码

git clone https://github.com/ultralytics/yolov5  # 或 yolov8
cd yolov5
pip install -r requirements.txt

② 配置文件说明（data.yaml）

yaml 复制代码

# SHWD 数据集配置
path: ./SHWD
train: images/train
val: images/val

# 类别定义（0=佩戴，1=未佩戴）
names:
  0: helmet_on    # 佩戴安全帽
  1: helmet_off   # 未佩戴安全帽

③ 启动训练

bash 复制代码

# YOLOv5 训练示例
python train.py --img 640 --batch 16 --epochs 100 --data data.yaml --weights yolov5s.pt

# YOLOv8 训练示例
yolo train model=yolov8s.pt data=data.yaml epochs=100 imgsz=640

④ 模型推理

bash 复制代码

# 单张图像检测
yolo predict model=best.pt source=test.jpg

# 视频流检测
yolo predict model=best.pt source=construction.mp4

06 获取方式

📥 下载地址 ：

数据集已托管至云服务器，方便国内用户下载。

后台回复关键词：安全帽检测

即可获取 百度网盘下载链接。