无人机航拍人体检测数据集｜低空巡检搜救智能监控｜YOLO目标检测算法训练集

无人机低空视觉｜人员检测数据集｜安防搜救场景专用目标检测样本库

航拍视角人体识别数据集｜应急救援智能巡检AI模型训练数据

低空经济带动无人机视觉应用快速落地，应急搜救、园区安防、野外巡检等场景，普遍面临高空远距离、复杂背景、目标偏小、人员遮挡等问题。通用公开数据集视角与真实航拍场景差异大，直接训练的模型极易出现漏检、误检、泛化能力不足的情况。本文结合工程实践，以GitHub项目规范完成内容梳理，详解无人机航拍人体检测数据集全维度信息，配套深度学习训练、格式转换、推理部署完整代码，可直接用于模型迭代与业务落地。

项目总览

项目简介

本项目聚焦无人机航拍视角下人体目标检测任务，采用单类别标注形式，剔除冗余标注信息，数据场景贴合低空巡检、灾害救援、区域安防等实际业务。数据集搭配全套工具脚本与YOLO系列算法工程代码，适配主流深度学习框架，支持快速划分数据集、标注格式转换、模型训练与线上推理，解决航拍小目标检测落地过程中的数据与工程问题。

数据集核心信息

信息项	详情
技术领域	计算机视觉、深度学习、目标检测
标注类别	仅person人体单类别，专项优化检测精度
数据载体	高清航拍图像，覆盖多拍摄角度、光照环境
存储格式	图像：JPG/PNG；标注：XML、JSON、YOLO-TXT
适用场景	应急救援、高空安防、人员统计、野外巡检、灾害定位
配套资源	数据集划分脚本、标注格式转换脚本、可视化脚本、模型训练与推理代码

核心优势

视角适配：全部数据取自无人机高空俯视、斜侧视视角，贴合设备真实作业状态；
标注纯净：仅保留人体目标，无多余类别干扰，模型训练收敛速度更快；
场景多元：包含城区、郊野、山地、阴影、逆光等复杂环境样本；
针对性强：大量远距离小目标、局部遮挡样本，强化模型低空检测鲁棒性；
兼容性高：原生适配YOLOv5/v7/v8等主流算法，无需大幅修改代码即可使用。

项目目录结构（GitHub标准规范）

复制代码

drone-person-dataset/
├── images/                # 原始航拍图像目录
│   ├── train/             # 训练集图像
│   ├── val/               # 验证集图像
│   └── test/              # 测试集图像
├── labels/                # 对应标注文件目录
│   ├── train/
│   ├── val/
│   └── test/
├── scripts/               # 通用工具脚本目录
│   ├── split_train_val.py # 自动划分训练/验证/测试集
│   ├── voc2yolo.py        # VOC标注转YOLO标准格式
│   └── vis_label.py       # 标注效果可视化校验
├── data.yaml              # YOLO算法数据集配置文件
├── train.py               # 模型训练主脚本
├── predict.py             # 图像/视频推理脚本
└── README.md              # 项目说明文档

深度学习实战代码

1. data.yaml 数据集配置文件

yaml 复制代码

# 场景注释：无人机低空搜救、高空巡检专用YOLO配置文件
# 适配航拍小目标，建议训练时调高输入分辨率提升检测效果
path: ./drone-person-dataset  # 数据集根目录相对路径
train: images/train           # 训练集图像路径
val: images/val               # 验证集图像路径
test: images/test             # 测试集图像路径

nc: 1                         # 目标类别数量，本项目仅人体1类
names: ['person']             # 类别名称映射

# 工程经验补充：
# 1. 航拍小目标优先设置imgsz为640/800，提升小目标检出率
# 2. 训练阶段开启mosaic、mixup数据增强，增强模型泛化性
# 3. 推理阶段适当下调置信度阈值，减少遮挡人体漏检问题

2. split_train_val.py 数据集自动划分脚本

python 复制代码

import os
import random
from pathlib import Path

# 场景注释：航拍数据集均衡划分，保证各场景样本分布均匀，避免单一场景过拟合
def split_dataset():
    # 原始图像文件夹路径
    img_dir = Path("./images")
    # 划分比例：训练集70%、验证集20%、测试集10%
    train_ratio = 0.7
    val_ratio = 0.2
    test_ratio = 0.1

    # 读取所有jpg、png格式航拍图像
    img_list = list(img_dir.glob("*.jpg")) + list(img_dir.glob("*.png"))
    # 随机打乱样本顺序，保证数据随机性
    random.shuffle(img_list)
    total_num = len(img_list)

    # 按比例切割数据集
    train_set = img_list[:int(total_num * train_ratio)]
    val_set = img_list[int(total_num * train_ratio):int(total_num * (train_ratio + val_ratio))]
    test_set = img_list[int(total_num * (train_ratio + val_ratio)):]

    # 输出划分结果统计
    print(f"训练集样本数：{len(train_set)}")
    print(f"验证集样本数：{len(val_set)}")
    print(f"测试集样本数：{len(test_set)}")

if __name__ == "__main__":
    split_dataset()

3. train.py YOLOv8 模型训练脚本

python 复制代码

from ultralytics import YOLO

# 场景注释：无人机端侧部署优先选用轻量模型，针对航拍遮挡、小目标做训练参数调优
if __name__ == "__main__":
    # 加载预训练权重，yolov8s为中型模型，兼顾精度与推理速度
    model = YOLO("yolov8s.pt")

    # 启动模型训练
    model.train(
        data="data.yaml",      # 加载数据集配置文件
        epochs=100,            # 总训练轮数
        imgsz=640,             # 模型输入图像尺寸，适配航拍图
        batch=16,              # 批次大小，根据硬件显存调整
        device=0,              # 指定使用GPU训练
        patience=15,          # 早停策略，15轮无精度提升则停止训练，防止过拟合
        lr0=0.01,              # 初始学习率
        lrf=0.01,              # 最终学习率系数
        momentum=0.937,        # 动量参数，加速梯度下降
        weight_decay=0.0005,   # 权重衰减，抑制过拟合
        warmup_epochs=3,       # 热身轮数，前期缓慢提升学习率
        cos_lr=True,           # 余弦学习率调度，提升收敛效果
        close_mosaic=10,       # 训练后期关闭马赛克增强，稳定模型精度
        name="drone_person_det"# 训练任务名称，结果自动存入对应文件夹
    )

4. predict.py 航拍图像/视频推理脚本

python 复制代码

from ultralytics import YOLO
import cv2

# 场景注释：适配无人机巡检图片、实时视频流推理，适配户外复杂航拍画面
def drone_predict():
    # 加载训练完成的最优权重文件
    model = YOLO("./runs/detect/drone_person_det/weights/best.pt")

    # 单张航拍图像推理，置信度0.25、IOU阈值0.45适配遮挡场景
    img_path = "test_drone.jpg"
    results = model.predict(source=img_path, conf=0.25, iou=0.45)

    # 绘制检测框并保存结果图
    result_img = results[0].plot()
    cv2.imwrite("predict_result.jpg", result_img)

    # 拓展：无人机视频流/本地视频推理，取消注释即可使用
    # model.predict(source="drone_video.mp4", save=True, stream=True)

if __name__ == "__main__":
    drone_predict()

5. voc2yolo.py 标注格式转换脚本

python 复制代码

import os
import xml.etree.ElementTree as ET

# 场景注释：将VOC格式XML标注转为YOLO标准TXT标注，数据集通用格式适配
def voc_to_yolo(voc_dir, yolo_dir, class_names):
    if not os.path.exists(yolo_dir):
        os.makedirs(yolo_dir)

    for xml_file in os.listdir(voc_dir):
        if not xml_file.endswith(".xml"):
            continue
        tree = ET.parse(os.path.join(voc_dir, xml_file))
        root = tree.getroot()
        img_w = int(root.find("size/width").text)
        img_h = int(root.find("size/height").text)

        txt_name = xml_file.replace(".xml", ".txt")
        txt_path = os.path.join(yolo_dir, txt_name)

        with open(txt_path, "w") as f:
            for obj in root.iter("object"):
                cls_name = obj.find("name").text
                if cls_name not in class_names:
                    continue
                cls_id = class_names.index(cls_name)

                # 解析标注框坐标
                bndbox = obj.find("bndbox")
                xmin = float(bndbox.find("xmin").text)
                ymin = float(bndbox.find("ymin").text)
                xmax = float(bndbox.find("xmax").text)
                ymax = float(bndbox.find("ymax").text)

                # 转换为YOLO归一化坐标格式
                x_center = (xmin + xmax) / 2.0 / img_w
                y_center = (ymin + ymax) / 2.0 / img_h
                width = (xmax - xmin) / img_w
                height = (ymax - ymin) / img_h

                f.write(f"{cls_id} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}\n")

if __name__ == "__main__":
    # 类别列表，本项目仅人体
    classes = ["person"]
    voc_to_yolo("./labels/voc", "./labels/yolo", classes)

落地应用方向

应急救援：山地、废墟、水域等场景下，通过无人机快速定位被困人员；
高空安防：厂区、园区、边境周界无人机巡检，实现人员入侵识别；
人流监测：广场、景区、大型活动区域，自动统计人员聚集与流动情况；
工业巡检：工地、矿区、户外场站，监测作业人员在岗与违规行为；
智慧城市：道路、社区高空画面分析，辅助城市管理与公共安全运维。

无人机航拍人体检测数据集｜低空巡检搜救智能监控｜YOLO目标检测算法训练集

无人机航拍人体检测数据集｜低空巡检搜救智能监控｜YOLO目标检测算法训练集

无人机低空视觉｜人员检测数据集｜安防搜救场景专用目标检测样本库

航拍视角人体识别数据集｜应急救援智能巡检AI模型训练数据

项目总览

项目简介

数据集核心信息

核心优势

项目目录结构（GitHub标准规范）

深度学习实战代码

1. data.yaml 数据集配置文件

2. split_train_val.py 数据集自动划分脚本

3. train.py YOLOv8 模型训练脚本

4. predict.py 航拍图像/视频推理脚本

5. voc2yolo.py 标注格式转换脚本

落地应用方向

标签