【目标检测】AGMF-Net:遥感目标检测的无注意力全局多尺度融合网络

《Attention-Free Global Multiscale Fusion Network for Remote Sensing Object Detection》

遥感目标检测的无注意力全局多尺度融合网络

原文:https://ieeexplore.ieee.org/document/10371366

摘要

遥感目标检测(RSOD)在复杂背景和小目标探测中面临挑战,它们相互关联,无法单独解决。为此,我们提出了一种无注意的全局多尺度融合网络(AGMF-Net)。最初,我们提出了一个空间偏差模块(SBM)来获得长期依赖关系,作为我们提出的全局信息提取模块(GIEM)的一部分。GIEM有效地捕捉了全球信息,克服了复杂背景所带来的挑战。此外,我们提出了多任务增强结构(MES)和多任务特征预处理(MFP)来增强多尺度目标的特征表示,同时消除了来自复杂背景的干扰。此外,本文还提出了一种有效的上下文解耦检测器(ECDD),为回归和分类任务提供了独特的特征,旨在提高RSOD的效率。大量的实验表明,我们提出的方法与最先进的探测器相比,取得了优越的性能。其中,AGMF-Net在光学遥感图像(DIOR)、高分辨率遥感检测(HRRSD)、西北理工大学极高分辨率-10(NWPU VHR-10)和RSOD数据集上的平均检测精度分别为73.2%、92.03%、95.21%和94.30%。

网络结构

GIEM(全局信息提取模块)

特征提取骨干网络由四个GIEM模块组成,能够从不同的深度提取全局语义信息。

GIEM模块结构:由多个空间偏差模块(SBM)组成,SBM将空间偏差图与卷积特征图相结合。这使得网络能够将来自空间偏差的全局知识与来自卷积特征图的局部特征结合起来,使其能够同时学习局部信息和全局信息。空间偏差捕获了更广泛的区域,而卷积特征聚焦于图像中的局部细节。

MES(多任务增强结构)

多尺度特征融合:通过 MFP(多任务特征预处理)模块和 GIEM 来增强特征表示,减少噪声干扰,为分类和定位任务提供融合的语义强特征和高分辨率特征图。

特征预处理:MFP 模块通过聚合信息(Q、K、V)来获得多尺度特征图,并使用 SBM 进行全局注意力提取,最后融合不同尺度的特征。

MSE

MFP

高效上下文解耦头(ECDD)

结构:通过 SBM 和 1×1 卷积层将输入预测特征图解耦为两个分支,分别用于分类和回归任务。

损失函数:使用变量焦点损失(VFL)来实现正负样本的不对称加权,强调正样本;使用完整交并比(CIOU)损失函数来考虑边界框的纵横比;引入距离焦点损失(DFL)函数来快速聚焦网络到目标附近的位置。

实验

不同数据集不同模块引入实验

baseline:DarkNet53

不同数据集和其他模型对比实验

代表性检测结果

RSOD数据集对比网络实验

不同模块可视化提取效果

相关推荐
小刘同学++8 分钟前
ECB(电子密码本,Electronic Codebook) 和 CBC(密码分组链接,Cipher Block Chaining)区分于用途
网络·ssl
gadiaola42 分钟前
【计算机网络】第3章:传输层—TCP 拥塞控制
网络·网络协议·tcp/ip·计算机网络
猎板PCB厚铜专家大族1 小时前
多层PCB技术解析:从材料选型到制造工艺的深度实践
网络·制造
浠寒AI2 小时前
智能体模式篇(上)- 深入 ReAct:LangGraph构建能自主思考与行动的 AI
人工智能·python
weixin_505154462 小时前
数字孪生在建设智慧城市中可以起到哪些作用或帮助?
大数据·人工智能·智慧城市·数字孪生·数据可视化
Best_Me072 小时前
深度学习模块缝合
人工智能·深度学习
YuTaoShao2 小时前
【论文阅读】YOLOv8在单目下视多车目标检测中的应用
人工智能·yolo·目标检测
FakeOccupational3 小时前
【碎碎念】宝可梦 Mesh GO : 基于MESH网络的口袋妖怪 宝可梦GO游戏自组网系统
网络·游戏
算家计算3 小时前
字节开源代码模型——Seed-Coder 本地部署教程,模型自驱动数据筛选,让每行代码都精准落位!
人工智能·开源
伪_装3 小时前
大语言模型(LLM)面试问题集
人工智能·语言模型·自然语言处理