导读
地下采煤导致的地表裂缝是矿区地质灾害最直接的信号------它不仅破坏地面承载力,还会加速地表水下渗,引发滑坡和塌陷等次生灾害。然而,矿区地裂缝的自动检测面临独特困难:裂缝形态高度不规则(宽窄共存、分支弯曲)、背景干扰严重(砾石、植被、土壤纹理),且裂缝像素在图像中占比极小。
河南理工大学团队提出了一套从检测到分析的完整框架:首先用改进的 DRA-UNet从无人机正射影像中分割裂缝(D=双注意力机制、R=残差学习、A=空洞空间金字塔池化),然后通过骨架提取和几何参数量化,对裂缝的长度、宽度、面积和矩形度进行系统分析,最终在工作面尺度上揭示裂缝的空间分布规律。
在霍家兔煤矿无人机数据集上,DRA-UNet 的 F1 达到 71.60%、MIoU 达到 70.00%,在六种方法中最优。在公开的 Crack500 数据集上跨场景验证,F1 进一步达到 85.32%、MIoU 达到 83.69%。消融实验验证了每个模块的贡献,几何分析揭示了裂缝长度、宽度、面积的右偏分布特征,以及裂缝密度和复杂度在工作面边界附近显著增高的空间规律。
论文信息
-
标题:Automatic identification and feature analysis of Mining-Induced surface cracks using an improved DRA-UNet
-
作者:Weiwei Zhou, Youfeng Zou, Huabin Chai
-
机构:Henan Polytechnic University, Jiaozuo, China
-
发表:Scientific Reports, 2026, 16:6591
一、矿区地裂缝:比路面裂缝难检测得多
与道路或混凝土裂缝相比,采矿诱发的地表裂缝在检测上面临更大挑战:
-
形态复杂:主裂缝与次生裂缝共存,宽窄差异大,常伴随分支和弯曲
-
背景干扰强:矿区地表有砾石、植被、土壤纹理和阴影,容易产生误检
-
空间分布受地质控制:裂缝分布与地质构造、开采推进方向和下沉梯度密切相关
-
类别极度不平衡:裂缝像素在图像中的占比极小,背景占据绝对主导
现有研究多集中于提升分割精度,而将裂缝检测与几何量化分析、空间分布分析结合的工作仍然不足。本文的目标正是建立一个检测+量化+空间分析的完整框架。
二、DRA-UNet:在U-Net上叠加三个增强模块
基础架构
以经典 U-Net为基线。选择 U-Net 的理由是:编码器-解码器结构配合跳跃连接,适合保留细长裂缝的空间细节;参数量适中,适合有限的矿区数据集;模块化结构便于逐一评估每个改进的贡献。
三个核心改进
1. 残差学习(R --- Basic Block)
在编码器和解码器的卷积层中引入 Basic Block 残差模块(即 ResNet 基本残差块:两层 3×3 卷积 + 跳跃连接),改善梯度流动,稳定深层网络训练。
2. 双注意力机制(D --- DAM)
DAM 由 位置注意力模块(PAM) 和 **通道注意力模块(CAM)**组成。在编码阶段,DAM 作用于高分辨率特征图,突出裂缝结构信息、抑制背景噪声;在解码阶段,DAM 利用局部和全局上下文细化上采样特征,使裂缝边界和纹理更清晰。
3. 空洞空间金字塔池化(A --- ASPP)
在瓶颈层嵌入 ASPP 模块,使用扩张率为 1、2、4、6 的空洞卷积加上全局平均池化,从多个感受野尺度提取语义特征,增强对不同宽度和复杂形态裂缝的识别能力。
三个模块的协作逻辑是:DAM 提供更干净、更聚焦的特征输入 → ASPP 在此基础上提取多尺度上下文信息 → 残差连接保证信息在深层网络中的高效流动。

图片来源于原论文
混合损失函数
针对裂缝像素占比极小的特点,设计了三组分混合损失:
| 组分 | 权重 | 作用 |
|---|---|---|
| Focal Tversky Loss | 0.6 | 加强对漏检(FN)的惩罚,聚焦难以检测的细长裂缝 |
| BCEWithLogitsLoss | 0.3 | 稳定像素级二分类概率优化 |
| Edge Consistency Loss | 0.1 | 基于 Sobel 梯度算子约束预测边界与真实边界的一致性 |
训练配置
| 参数 | 设置 |
|---|---|
| 框架 | PyTorch |
| 优化器 | AdamW |
| 学习率 | 1×10⁻⁴ |
| 批大小 | 8 |
| 输入尺寸 | 256×256 像素 |
| 最大轮次 | 200 |
| 数据增强 | 亮度/对比度调整、水平/垂直翻转、90°/180°旋转 |
三、霍家兔煤矿数据集与实验结果
研究区域与数据集
霍家兔煤矿位于陕西省榆林市大柳塔镇,处于陕西与内蒙古交界、毛乌素沙漠南部。研究选取的工作面走向长度约 2700 m,倾向长度约 300 m,开采 2-2 号煤层(平均埋深约 145 m,平均厚度约 4.2 m)。
无人机影像由 DJI M300-RTK 搭载 Zenmuse H20T 传感器(集成广角相机、热成像和激光测距)采集,地面分辨率 2.76 cm 。影像经 Pix4DMapper 处理后生成正射影像,裁切为 256×256 像素块(25%重叠),共生成 6000 个样本,按 8:1:1 划分训练/验证/测试集。标注采用人工目视解释后二值化(背景=0,裂缝=255)。
与五种方法的性能对比
| 模型 | Pr(%) | Re(%) | F1(%) | MIoU(%) |
|---|---|---|---|---|
| DeepLabV3+ | 71.21 | 69.12 | 70.15 | 65.10 |
| SegNet | 63.55 | 68.46 | 65.91 | 63.59 |
| PSPNet | 64.76 | 68.41 | 66.53 | 67.57 |
| SegFormer | 67.01 | 69.63 | 68.29 | 69.25 |
| FastSCNN | 62.90 | 67.08 | 64.92 | 66.96 |
| DRA-UNet | 71.10 | 72.20 | 71.60 | 70.00 |
DRA-UNet 的 Precision 略低于 DeepLabV3+(71.10% vs 71.21%),但 Recall 在所有模型中最高(72.20%),说明其对裂缝的捕获能力更强。F1 和 MIoU 均为最优,分别比次优方法高出 +1.45(vs DeepLabV3+ 的 70.15%)和 +0.75(vs SegFormer 的 69.25%)。

图片来源于原论文
Crack500 跨场景验证
为验证泛化能力,在公开的 Crack500 数据集(路面裂缝)上测试:
| 模型 | Pr(%) | Re(%) | F1(%) | MIoU(%) |
|---|---|---|---|---|
| DeepLabV3+ | 80.12 | 85.13 | 82.55 | 81.84 |
| SegNet | 81.28 | 86.96 | 84.02 | 80.64 |
| PSPNet | 80.55 | 83.89 | 82.19 | 83.01 |
| SegFormer | 82.21 | 83.23 | 82.72 | 83.26 |
| FastSCNN | 83.85 | 85.49 | 84.66 | 82.54 |
| DRA-UNet | 83.12 | 87.68 | 85.32 | 83.69 |
DRA-UNet 的 MIoU 最高(83.69%),Recall 和 F1 同样最优。Precision 略低于 FastSCNN(83.12% vs 83.85%),但综合分割质量最佳。
四、消融实验:三个模块各贡献多少?
在矿区无人机数据集上,对残差模块(ResNet)、双注意力机制(DAM)和 ASPP 三个组件进行消融实验:
| 配置 | Pr(%) | Re(%) | F1(%) | MIoU(%) |
|---|---|---|---|---|
| U-Net(基线) | 65.52 | 67.43 | 66.46 | 65.90 |
| + ResNet | 68.46 | 68.97 | 68.71 | 66.86 |
| + DAM | 66.57 | 67.56 | 67.06 | 66.05 |
| + ASPP | 66.78 | 67.44 | 67.11 | 66.88 |
| + ResNet + DAM | 68.90 | 70.08 | 69.48 | 68.23 |
| + ResNet + ASPP | 68.98 | 69.53 | 69.25 | 67.95 |
| + DAM + ASPP | 67.46 | 67.58 | 67.52 | 67.44 |
| + ResNet + DAM + ASPP | 71.10 | 72.20 | 71.60 | 70.00 |
几个关键发现:
-
残差模块贡献最大:单独加入 ResNet,F1 从 66.46% 提升到 68.71%(+2.25),而 DAM 和 ASPP 单独加入的提升分别仅为 +0.60 和 +0.65
-
DAM 和 ASPP 需要残差基础才能发挥最大作用:DAM+ASPP 组合(无 ResNet)F1 仅为 67.52%,但 ResNet+DAM+ASPP 三者联合达到 71.60%,说明残差连接为注意力和多尺度模块提供了更优质的特征基础
-
三模块联合的增益大于任意两两组合:最终 F1(71.60%)比最优两模块组合 ResNet+DAM(69.48%)还高 +2.12,呈现协同增益
五、总结与思考
本文提出了面向矿区地表裂缝的完整框架:DRA-UNet 语义分割(F1=71.60%/MIoU=70.00%)→ 骨架提取与几何量化 → 工作面尺度空间分析。几何分析揭示裂缝长度、宽度和面积均呈右偏长尾分布(均值:长度 2.12 m,宽度 7.73 cm),矩形度随裂缝长度增加而下降;空间分析表明工作面边界附近裂缝密度和复杂度显著增高,内部裂缝呈特征性的"C形"张开模式。
在此基础上,有几点值得进一步思考:
-
检测-量化-空间分析的三层框架是本文的核心贡献。多数裂缝检测论文止步于分割精度,而本文将骨架提取和几何参数量化纳入流程,使检测结果能直接服务于灾害评估和维护决策------这种"从像素到工程"的思路值得参考。
-
单矿区数据存在局限。6000 个样本均来自霍家兔煤矿,属于半干旱环境。Crack500 的跨场景验证虽然表现不错(MIoU=83.69%),但路面裂缝与采矿地裂缝在形态和背景上存在本质差异,跨域适用性仍需进一步验证。
-
论文定位为离线分析工具,未报告推理速度和计算资源需求。对于需要快速响应的矿区巡检场景,如何部署到无人机机载平台或边缘设备是后续需要解决的问题。
-

