DiffDet4SAR——首次将扩散模型用于SAR图像目标检测,来自2024 GRSL(ESI高被引1%论文)

一. 论文摘要

合成孔径雷达(SAR)图像中的飞机目标检测是一项具有挑战性的任务,由于离散的散射点和严重的背景杂波干扰。目前,基于卷积或基于变换的方法不能充分解决这些问题。

本文首次探讨了SAR图像飞机目标检测的扩散模型,并提出了一种新的基于扩散模型的SAR图像的飞机目标检测模型。所提出的DiffDet 4SAR产生用于SAR飞机目标检测的两个主要优点:1)DiffDet4SAR将SAR飞机目标检测任务映射到边界框的去噪扩散过程,而无需启发式锚大小选择,2)专门设计的散射特征增强(SFE)模块进一步降低了杂波强度,并在推理过程中增强了目标显著性。在SAR-AIRcraft-1.0数据集上的大量实验结果表明,所提出的DiffDet4SAR实现了88.4%mAP50,比最先进的方法高出6%。

二. 模型整体架构

(a)我们提出的DiffDet4SAR的总体框架和(b)SFE模块(Scattering Feature Enhancement Module 散射特征增强模块)的详细实现。主干从输入SAR图像中提取特征图,SFE模块应用于高级语义特征图。以噪声边界框和多尺度特征作为输入,检测器然后预测目标类别,位置此外,我们还设计了SFE模块来抑制背景杂波,增强目标的显著性。

整体框架的细节这里就不赘述了,因为DiffDet4SAR是在DiffusionDet的基础上完成的,整体框架几乎和DiffusionDet完全一致,有关于DiffusionDet的完整详细的解读大家可以参考我的这篇博客:

DiffusionDet: Diffusion Model for Object Detection------首次将扩散模型用于目标检测的模型https://blog.csdn.net/LWK999999/article/details/149329493?spm=1001.2014.3001.5501

论文创新点

  1. 据我们所知,这篇论文介绍了第一个将扩散模型引入SAR目标检测的研究,提供了一个新颖的、高度简单但有效的框架,称为DiffDet 4SAR,专为SAR目标检测而设计。

  2. 提出的DiffDet 4SAR基于两个核心设计:首先,我们将SAR目标检测问题转化为从噪声包围盒到精确目标包围盒的去噪扩散过程;其次,我们设计了一个SFE模块,有效地降低背景杂波的散射强度,突出目标,以缓解飞机目标散射点离散和背景干扰严重的问题。

  3. 通过结合这两种设计,DiffDet 4SAR的性能在SAR-AIRcraft-1.0数据集上显著超过了最新技术水平。

三. SFE 散射特征增强模块

SAR 图像中的飞机目标具有以下特点:

  • 离散散射点结构:目标结构不连续,容易被误检/漏检;

  • 背景杂波强:建筑物、金属体等背景物体的散射强度接近飞机;

  • 高分辨率但低对比度:使得目标边界模糊,难以准确定位。

因此,传统特征提取模块容易受到纹理噪声干扰,SFE 模块被提出用于增强目标显著性并抑制背景。

SFE 模块主要包含两部分:

1. 中心像素差卷积(PDC:Pixel Difference Convolution)

  • 作用:替代普通卷积,突出目标区域的异质性,压制背景的同质性。

  • 原理:在每个局部区域中,不是直接卷积计算加权和,而是用当前像素与其邻域像素的差值作为输入。

数学公式:

  • vanilla convolution

  • PDC:

    其中 是卷积窗口中当前像素与其邻居像素对。

直观理解:对于背景区域,由于其纹理一致,差值很小 → 被压制;目标区域结构复杂,差值较大 → 被增强。


2. 高层语义特征处理与融合

  • PDC 并不是用于浅层特征,因为浅层更关注纹理细节,会产生误增强(false alarm);

  • 它被应用于 高层语义特征图(如 P5),这些层包含更加稳定的目标语义信息;

  • 融合策略:将原始特征图和 PDC 后的特征图做融合(类似残差连接):

3. SFE 模块的工作流程(总结)

  1. 从主干网络(ResNet50)中提取高层特征图(如 P5 层);

  2. 对特征图进行中心差分卷积处理,得到抑制背景、增强目标的特征图

  3. 将原始特征图与差分卷积结果进行融合,增强目标区域的散射特征;

  4. 送入 ROI Align 和检测头进行类别与边界框预测。

所提出的SFE模块对不同深度的特征图的影响。结果显示了没有(顶行)和有SFE模块的特征图(底行)。特征图从左到右,即从p2到p5变得更深。红框表示ground truth,绿色框表示检测结果。紫色椭圆表示在特征层p5中未使用SFE模块的情况下出现假阴性的实例。使用 SFE 后,目标区域更亮,背景杂波明显减弱。

四. 实验结果

1. 普通实验结果

SAR-AIRcraft-1.0数据集检测性能比较。每个类别的结果由mAP(%)和F1-SCORE(%)表示,交集超过联合阈值0.5(IOU = 0.5)。最佳和次佳结果以粗体和下划线显示。

在随机选择的图像上显示不同方法下的检测结果。红色框表示真实值,绿色框表示检测结果。黄色椭圆表示误报,紫色椭圆表示误报实例。

2. 消融实验结果

2.1 SFE 模块的有效性消融实验

目的:验证中心像素差卷积(PDC)和特征融合策略在不同特征层(P3、P4、P5)上的效果。

  • 单独使用 PDC:在不同层上(P3/P4/P5)都有提升,但提升有限。

  • 最佳效果出现在融合 Vanilla+PDCp5 的组合,其中:

    • mAP50 提升至 88.4%(+1.8%)

    • mAP75 提升至 68.2%(+1.3%)

    • 小目标检测(mAPs)从 13.6% 大幅提升至 30.0%!

  • 将 PDC 应用于语义特征最强的 P5 层,结合原始特征可以保留背景上下文,同时突出目标差异。

  • 对小目标的增强尤其明显,说明 SFE 对微弱目标信号具有放大作用。

2.2 Signal Scale(扩散信号强度)消融实验

目的:研究扩散过程中的信号缩放因子(SNR 控制)对检测效果的影响。

  • 过低(0.1)→ 噪声不足,难以学习鲁棒特征;

  • 过高(2.0、3.0)→ 噪声过大,目标信息被背景杂波掩盖;

  • scale=1.0 达到最优效果,说明在 SAR 图像中适中 SNR 能平衡"泛化性"与"细节保留"。

2.3 与 ****匹配性消融实验

目的:探索训练阶段使用的噪声框数量和推理阶段采样框数****对性能的影响。

  • 训练时的 更关键,使用更多的随机框训练(如 500)能更好学习目标的纹理和分布;

  • 推理时的数量影响不大,因为大部分框最终被非极大值抑制(NMS)抛弃。

相关推荐
橡晟5 小时前
深度学习入门:让神经网络变得“深不可测“⚡(二)
人工智能·python·深度学习·机器学习·计算机视觉
墨尘游子5 小时前
神经网络的层与块
人工智能·python·深度学习·机器学习
Leah01055 小时前
什么是神经网络,常用的神经网络,如何训练一个神经网络
人工智能·深度学习·神经网络·ai
PyAIExplorer5 小时前
图像亮度调整的简单实现
人工智能·计算机视觉
Rvelamen7 小时前
LLM-SECURITY-PROMPTS大模型提示词攻击测评基准
人工智能·python·安全
AI technophile7 小时前
OpenCV计算机视觉实战(15)——霍夫变换详解
人工智能·opencv·计算机视觉
JNU freshman8 小时前
计算机视觉 之 数字图像处理基础(一)
人工智能·计算机视觉
鹧鸪云光伏8 小时前
鹧鸪云重构光伏发电量预测的精度标准
人工智能·无人机·光伏·光伏设计·光伏模拟
九章云极AladdinEdu8 小时前
摩尔线程MUSA架构深度调优指南:从CUDA到MUSA的显存访问模式重构原则
人工智能·pytorch·深度学习·机器学习·语言模型·tensorflow·gpu算力