无人机山地灾害巡检数据集 | 滑坡多区域实例分割遥感影像解译地质灾害预警深度学习数据10296期

标签：#无人机山地巡检 #山体滑坡分割 #实例分割 #地质灾害预警 #遥感影像智能解译 #道路灾害封堵检测 #深度学习数据集 #防灾减灾 #多格式标注 #空天地一体化监测

山区地形复杂、岩土结构脆弱，强降雨、地质活动极易诱发山体滑坡，不仅会摧毁山体植被、阻断山区道路，还会威胁沿线居民与通行人员的生命财产安全。传统滑坡监测依赖地质人员野外实地勘查、人工解译航拍与卫星影像，不仅野外作业风险极高、巡检覆盖范围有限，也难以精准区分滑坡体本体、潜在滑动带、滑坡影响区 三大区域，无法提前预判隐患发展趋势。当下无人机巡检结合像素级实例分割技术，成为地质灾害自动化监测的主流方案，但符合专业地质勘查标准、多区域细分标注、兼容多种算法框架的实景数据集较为稀缺。本次分享的山体滑坡专项数据集，由工业级航拍影像制作而成，细分三类滑坡核心区域，同时支持掩膜、边界框等多种标注格式，可直接用于实例分割、目标检测模型训练，适配无人机巡检、卫星遥感解译、道路灾害封堵监测等场景，为滑坡智能预警、灾情量化评估提供可靠的数据底座。

一、项目总览

1.1 数据集定位

本数据集是面向无人机航拍、卫星遥感场景的山体滑坡多区域实例分割数据集 ，聚焦山地滑坡全要素识别任务，严格按照地质勘查标准划分标注目标，可同时满足实例分割、目标检测两类计算机视觉任务。数据集全部采用野外实景航拍影像，影像分辨率达到工业级标准，能够清晰呈现滑坡裂缝、岩土纹理、滑动边界等细节特征，标注精度对标专业地质勘查要求，适配YOLO系列、Mask R-CNN、U-Net、DeepLabv3+等主流深度学习框架，是地质灾害AI监测、山区道路防灾、遥感影像自动化解译领域的轻量化优质基准数据。

1.2 核心基础信息表

信息维度	详细参数
核心任务	多区域实例分割、滑坡目标检测、灾害范围测算
标注目标	滑坡体本体、潜在滑动带、滑坡影响区（3类地质分区）
数据总量	合计639张工业级实景航拍影像，样本质量高、细节丰富
标注格式	实例分割掩膜格式、目标检测边界框格式，兼容多通道影像分层存储
数据集划分	按行业标准划分为训练集、验证集、测试集，适配模型全流程训练
影像特性	工业级航拍分辨率，清晰保留滑坡裂缝、岩土形变等关键特征
适用框架	YOLOv5-seg/YOLOv8-seg、Mask R-CNN、U-Net、SSD、Faster R-CNN
落地场景	无人机山体巡检、卫星遥感解译、道路滑坡封堵监测、滑坡预警、灾后灾情评估

1.3 标注目标专业释义

结合地质灾害勘查规范，对三类标注对象做工程化解读，帮助算法开发者理解业务逻辑：

滑坡体本体：已经发生滑动、出现明显岩土位移的核心区域，是滑坡灾害的主体，属于高风险区域；
潜在滑动带：山体出现裂缝、岩土松动，但暂未发生整体滑动的隐患区域，是滑坡预警的重点监测对象；
滑坡影响区：受滑坡牵连、碎石散落、地形改变波及的周边区域，用于评估灾害影响范围与道路封堵情况。

1.4 数据集核心优势与技术难点

核心优势
- 标注专业性强：细分三大滑坡功能区域，区别于普通单类别滑坡数据集，贴合地质勘查实际工作流程，可支撑精细化灾害分析；
- 多格式兼容：一套数据同时支持分割掩膜、检测框两种标注，无需额外转换即可适配不同算法，降低项目开发成本；
- 影像质量优异：工业级分辨率影像完整保留滑坡细微纹理、裂缝特征，助力模型学习细粒度灾害特征；
- 样本场景纯粹：全部为野外实景采集样本，覆盖不同滑坡规模、不同地形环境，适配真实巡检工况。
技术难点
- 区域边界模糊：潜在滑动带与正常山体、滑坡影响区之间过渡平缓，边界难以区分，对模型轮廓提取能力要求高；
- 特征相似度高：三类滑坡区域纹理、色彩接近，模型易出现类别混淆，需依靠语义特征完成区分；
- 地形干扰复杂 ：山体陡坡、植被、岩石、阴影等背景会掩盖滑坡特征，增加识别与分割难度。

二、数据集目录结构与标注规范

2.1 标准目录结构

采用多格式数据通用目录架构，区分图像、分割掩膜、检测标注、配置文件，适配训练、验证、测试子集划分，兼容分割与检测双任务，解压后可直接投入使用：

复制代码

mountain_landslide_dataset/
├── images/                # 航拍原始图像文件夹
│   ├── train/             # 训练集图像
│   ├── val/               # 验证集图像
│   └── test/              # 测试集图像
├── masks/                 # 实例分割掩膜文件（png格式，像素级标注）
│   ├── train/
│   ├── val/
│   └── test/
├── labels/                # 目标检测边界框标注（YOLO txt格式）
│   ├── train/
│   ├── val/
│   └── test/
├── multi_task.yaml        # YOLO系列模型配置文件（分割+检测双任务）
├── class_mapping.txt       # 类别ID与地质名称映射表
└── README.md              # 采集说明、标注规则、使用协议、影像参数

2.2 多格式标注规则

目标检测（YOLO边界框格式）
单行规则：类别ID x中心 y中心框宽框高，坐标基于图像尺寸归一化，取值范围 [0,1]；ID映射：0=滑坡体本体、1=潜在滑动带、2=滑坡影响区。
实例分割（掩膜格式）
采用单通道PNG掩膜图，不同像素值对应不同滑坡区域，像素值与类别ID一一对应，实现像素级区域划分。
文件匹配规则：原始图像、掩膜文件、标注文件三者文件名完全一致，保证数据一一对应。

三、深度学习全流程实战代码

基于 YOLOv8-seg 框架开发全套代码，兼顾实例分割与目标检测双任务，包含环境部署、多格式数据集校验、配置文件编写、模型训练、批量推理、性能评估模块。所有代码结合山地滑坡多区域识别、航拍复杂地形场景添加专属注释，针对三类滑坡区域特征完成超参调优。

3.1 环境依赖安装

适配 Python 3.8 ~ 3.11 版本，推荐CUDA加速的GPU环境运行，一键安装全量依赖：

bash 复制代码

# Windows/Linux 通用安装命令，支持分割、检测双任务
pip install ultralytics torch opencv-python numpy pyyaml tqdm pillow matplotlib

3.2 数据集配置文件 multi_task.yaml

适配YOLOv8分割/检测双任务，定义路径、类别等核心参数，直接复制使用：

yaml 复制代码

# 山体滑坡多区域分割+检测数据集配置文件
path: ./mountain_landslide_dataset  # 数据集根目录
train: images/train
val: images/val
test: images/test

# 目标类别：3类滑坡分区
nc: 3
names:
  0: Landslide_Body      # 滑坡体本体
  1: Potential_Slide_Zone# 潜在滑动带
  2: Affected_Area       # 滑坡影响区

3.3 多格式数据集校验代码

场景注释：本数据集同时包含掩膜、边界框两种标注，易出现文件缺失、类别ID错误、坐标越界、掩膜与图像不匹配等问题。山地航拍图像还存在分辨率差异、格式混杂问题。本脚本批量校验图像、掩膜、标注三者匹配关系，统计各类别样本数量，提前排查数据问题，避免训练中断。

python 复制代码

from pathlib import Path
from tqdm import tqdm
import cv2

# 全局路径配置，根据本地路径修改
ROOT = Path("./mountain_landslide_dataset")
IMG_DIR = ROOT / "images"
MASK_DIR = ROOT / "masks"
LABEL_DIR = ROOT / "labels"
CLASS_NUM = 3  # 3类滑坡分区

def check_landslide_dataset():
    """校验图像、分割掩膜、检测标注三者完整性与合法性"""
    total_error = 0
    class_count = [0] * CLASS_NUM

    # 遍历训练、验证、测试子集
    for split in ["train", "val", "test"]:
        img_path = IMG_DIR / split
        mask_path = MASK_DIR / split
        label_path = LABEL_DIR / split

        # 校验基础文件夹
        if not all([img_path.exists(), mask_path.exists(), label_path.exists()]):
            print(f"【严重错误】{split} 目录缺失，跳过该校验子集")
            total_error += 1
            continue

        img_list = list(img_path.glob("*.jpg")) + list(img_path.glob("*.png"))
        print(f"\n开始校验 {split} 子集，图像总数：{len(img_list)}")

        for img_file in tqdm(img_list):
            file_name = img_file.stem
            # 1. 校验分割掩膜文件
            mask_file = mask_path / f"{file_name}.png"
            if not mask_file.exists():
                print(f"【掩膜缺失】{img_file.name} 无对应分割掩膜")
                total_error += 1
                continue
            # 读取掩膜，校验像素值合法性
            mask = cv2.imread(str(mask_file), cv2.IMREAD_GRAYSCALE)
            unique_pixel = set(mask.flatten())
            for pixel in unique_pixel:
                if pixel not in [0, 1, 2, 255]:
                    print(f"【掩膜异常】{mask_file.name} 存在非法像素值：{pixel}")
                    total_error += 1

            # 2. 校验检测标注文件
            label_file = label_path / f"{file_name}.txt"
            if not label_file.exists():
                print(f"【标注缺失】{img_file.name} 无对应检测标注")
                total_error += 1
                continue

            # 解析YOLO标注
            with open(label_file, "r", encoding="utf-8") as f:
                lines = f.readlines()
                for line in lines:
                    line = line.strip()
                    if not line:
                        continue
                    parts = list(map(float, line.split()))
                    if len(parts) != 5:
                        print(f"【格式错误】{label_file.name} 标注字段异常")
                        total_error += 1
                        continue
                    cls_id, x, y, w, h = parts
                    # 校验类别ID
                    if not (0 <= cls_id < CLASS_NUM):
                        print(f"【ID错误】{label_file.name} 非法类别ID：{int(cls_id)}")
                        total_error += 1
                        continue
                    class_count[int(cls_id)] += 1
                    # 校验归一化坐标
                    if not (0 <= x <= 1 and 0 <= y <= 1 and 0 <= w <= 1 and 0 <= h <= 1):
                        print(f"【坐标越界】{label_file.name} 标注坐标超出范围")
                        total_error += 1

    # 输出校验结果
    print("\n===== 数据集整体校验结果 =====")
    if total_error == 0:
        print("✅ 图像、掩膜、标注全部校验通过，可启动模型训练！")
    else:
        print(f"❌ 累计发现 {total_error} 处异常，请修复后再使用数据！")

    # 输出三类滑坡区域样本统计
    print("\n===== 滑坡分区样本数量统计 =====")
    class_name = ["滑坡体本体", "潜在滑动带", "滑坡影响区"]
    for idx, name in enumerate(class_name):
        print(f"{idx} | {name} 总样本数：{class_count[idx]}")

if __name__ == "__main__":
    check_landslide_dataset()

3.4 YOLOv8-seg 模型训练代码（滑坡多分区专项调优）

场景注释：三类滑坡区域特征相近、边界模糊，属于细粒度分割任务；山地航拍存在光照不均、植被遮挡等干扰。训练时提升迭代轮数保证细粒度特征收敛，启用分割专属增强提升边界分割精度；选用AdamW优化器优化类别区分能力；设置合理早停参数，规避小体量数据集过拟合问题；降低置信度阈值，保障潜在滑动带等弱特征目标不被漏检。

python 复制代码

from ultralytics import YOLO

def train_landslide_seg_model():
    """训练山体滑坡三分区实例分割模型"""
    # 选用YOLOv8s-seg，平衡精度与推理速度，适配航拍分割场景
    model = YOLO("yolov8s-seg.pt")

    # 面向滑坡多分区场景的超参调优
    train_res = model.train(
        data="./mountain_landslide_dataset/multi_task.yaml",
        epochs=130,          # 细粒度多分类任务，增加迭代轮数强化特征学习
        batch=10,            # 8G显存推荐8-10，适配小体量数据集
        imgsz=640,           # 统一输入尺寸，匹配航拍影像特征尺度
        device=0,            # GPU训练，无GPU改为 device="cpu"
        lr0=0.0006,          # 低学习率，避免多类别特征训练震荡
        optimizer="AdamW",
        augment=True,        # 全局增强，适配山地光照、角度变化
        copy_paste=0.25,     # 分割增强，强化模糊边界区域的分割效果
        mosaic=1.0,
        patience=28,         # 早停策略，防止小数据集过拟合
        conf=0.18,           # 低置信度，捕捉潜在滑动带等弱特征目标
        project="landslide_seg_run",
        name="yolov8_3cls_landslide",
        save_best=True,
        plots=True
    )
    print(f"🎉 训练完成！最优权重路径：{train_res.save_dir}/weights/best.pt")

if __name__ == "__main__":
    train_landslide_seg_model()

3.5 批量影像推理与可视化代码

场景注释 ：模拟无人机批量巡检、遥感影像批量解译流程，同时输出检测框与分割掩码。防灾场景中，潜在滑动带漏检会直接导致预警失效，因此设置极低置信度阈值；推理结果可统计各分区面积，自动判断道路封堵情况，对接防灾预警平台生成巡检报告。

python 复制代码

import cv2
from pathlib import Path
from ultralytics import YOLO

# 推理全局配置
BEST_MODEL = "./landslide_seg_run/yolov8_3cls_landslide/weights/best.pt"
TEST_IMG = Path("./mountain_landslide_dataset/images/test")
CONF = 0.18
IOU = 0.42

def landslide_batch_infer():
    """批量滑坡影像分割推理，输出分区结果与可视化图像"""
    model = YOLO(BEST_MODEL)
    img_list = list(TEST_IMG.glob("*.jpg")) + list(TEST_IMG.glob("*.png"))
    print(f"开始批量推理，待处理航拍图像数量：{len(img_list)}")

    for img in img_list:
        results = model(
            source=str(img),
            conf=CONF,
            iou=IOU,
            save=True,
            show_labels=True,
            show_conf=True
        )
        # 解析结果
        for res in results:
            if res.masks is None:
                print(f"【{img.name}】未检测到滑坡相关区域")
                continue
            for idx in range(len(res.boxes)):
                cls_id = int(res.boxes.cls[idx])
                conf_score = float(res.boxes.conf[idx])
                cls_name = res.names[cls_id]
                print(f"【{img.name}】识别区域：{cls_name}，置信度：{conf_score:.2f}")

if __name__ == "__main__":
    landslide_batch_infer()

3.6 模型综合性能评估代码

场景注释 ：滑坡监测属于安全敏感场景，重点关注召回率与分割掩码mAP，尤其是潜在滑动带的识别精度。本代码输出检测、分割双维度指标，可用于模型性能评估与不同算法横向对比。

python 复制代码

from ultralytics import YOLO

def evaluate_landslide_model():
    """评估滑坡多分区分割模型综合性能"""
    model = YOLO("./landslide_seg_run/yolov8_3cls_landslide/weights/best.pt")
    metrics = model.val(
        data="./mountain_landslide_dataset/multi_task.yaml",
        conf=0.18,
        iou=0.42
    )
    # 打印核心指标
    print("===== 山体滑坡三分区模型评估指标 =====")
    print(f"检测 mAP@0.5：{metrics.box.map50:.4f}")
    print(f"分割掩码 mAP@0.5：{metrics.seg.map50:.4f}")
    print(f"平均精确率 Precision：{metrics.box.precision:.4f}")
    print(f"平均召回率 Recall：{metrics.box.recall:.4f}")

if __name__ == "__main__":
    evaluate_landslide_model()

四、数据集应用价值与落地场景

4.1 核心应用价值

专业数据支撑：细分三类滑坡功能区域，贴合地质勘查业务，助力研发精细化滑坡监测算法，区分已发灾害与潜在隐患；
多任务适配：一套数据支持分割、检测双任务，降低多算法并行研发的数据成本，适用于复合型智能监测系统；
提升防灾时效：自动化完成滑坡区域识别、范围测算、道路封堵判断，将传统人工解译数小时的工作量压缩至秒级；
降低作业风险：依托无人机+AI实现非接触式监测，减少地质人员进入高危滑坡区域的作业风险。

4.2 主流落地场景

无人机山体巡检：山区常态化巡检，实时识别滑坡体、潜在滑动带，推送灾害预警；
卫星遥感解译：大范围区域滑坡普查、历史遥感影像分析，统计区域灾害分布；
道路防灾监测：山区公路、盘山公路滑坡封堵检测，保障道路通行安全；
灾后应急评估：滑坡灾害发生后，快速划分灾害分区、测算影响范围，辅助救援决策；
科研教学：地质工程、遥感科学、人工智能交叉学科实验、毕业设计、算法竞赛。

五、使用规范与优化建议（GitHub Tips）

$!NOTE$

数据集仅限学术研究、算法开发、项目测试使用，禁止商用倒卖、二次分发；

数据集共639张图像，属于中小体量样本，训练时建议搭配适度数据增强，严格控制模型复杂度，避免过拟合；

掩膜格式可直接迁移至U-Net、DeepLabv3+等语义分割框架，边界框标注可用于传统目标检测模型；

影像为工业级航拍分辨率，不建议大幅压缩图像尺寸，防止滑坡细微裂缝、边界特征丢失。

$!TIP$

边缘端部署：无人机机载设备优先选用YOLOv8-n-seg轻量化模型，配合TensorRT量化加速，提升端侧推理速度；

精度优化：针对三类区域特征混淆问题，可增加色彩扰动、随机遮挡等增强，或采用多分支网络区分语义特征；

数据扩充：可结合GAN生成滑坡样本，或拼接野外航拍图像，扩充数据集规模，进一步提升模型泛化能力。

六、深度拓展方向（技术延伸思考）

多任务联动 ：在分割检测基础上增加灾害风险评级 、道路封堵等级判断，实现"识别-评级-研判"一体化；
时序分析：结合多期航拍影像构建时序模型，监测潜在滑动带的变化趋势，实现中长期滑坡风险预判；
多源数据融合：叠加DEM高程、坡度、坡向等地理数据，融合影像特征与地形特征，提升复杂山地识别精度；
视频流实时监测：基于OpenCV对接无人机实时视频流，实现动态航拍画面逐帧分割，适配移动巡检场景。

文末全量标签

#无人机山体巡检 #山体滑坡分割 #实例分割 #地质灾害预警 #遥感影像解译 #道路滑坡封堵检测 #深度学习数据集 #防灾减灾 #YOLO分割实战 #空天地监测 #地质AI勘查

无人机山地灾害巡检数据集 | 滑坡多区域实例分割 遥感影像解译 地质灾害预警深度学习数据10296期