【目标检测】AGMF-Net:遥感目标检测的无注意力全局多尺度融合网络

《Attention-Free Global Multiscale Fusion Network for Remote Sensing Object Detection》

遥感目标检测的无注意力全局多尺度融合网络

原文:https://ieeexplore.ieee.org/document/10371366

摘要

遥感目标检测(RSOD)在复杂背景和小目标探测中面临挑战,它们相互关联,无法单独解决。为此,我们提出了一种无注意的全局多尺度融合网络(AGMF-Net)。最初,我们提出了一个空间偏差模块(SBM)来获得长期依赖关系,作为我们提出的全局信息提取模块(GIEM)的一部分。GIEM有效地捕捉了全球信息,克服了复杂背景所带来的挑战。此外,我们提出了多任务增强结构(MES)和多任务特征预处理(MFP)来增强多尺度目标的特征表示,同时消除了来自复杂背景的干扰。此外,本文还提出了一种有效的上下文解耦检测器(ECDD),为回归和分类任务提供了独特的特征,旨在提高RSOD的效率。大量的实验表明,我们提出的方法与最先进的探测器相比,取得了优越的性能。其中,AGMF-Net在光学遥感图像(DIOR)、高分辨率遥感检测(HRRSD)、西北理工大学极高分辨率-10(NWPU VHR-10)和RSOD数据集上的平均检测精度分别为73.2%、92.03%、95.21%和94.30%。

网络结构

GIEM(全局信息提取模块)

特征提取骨干网络由四个GIEM模块组成,能够从不同的深度提取全局语义信息。

GIEM模块结构:由多个空间偏差模块(SBM)组成,SBM将空间偏差图与卷积特征图相结合。这使得网络能够将来自空间偏差的全局知识与来自卷积特征图的局部特征结合起来,使其能够同时学习局部信息和全局信息。空间偏差捕获了更广泛的区域,而卷积特征聚焦于图像中的局部细节。

MES(多任务增强结构)

多尺度特征融合:通过 MFP(多任务特征预处理)模块和 GIEM 来增强特征表示,减少噪声干扰,为分类和定位任务提供融合的语义强特征和高分辨率特征图。

特征预处理:MFP 模块通过聚合信息(Q、K、V)来获得多尺度特征图,并使用 SBM 进行全局注意力提取,最后融合不同尺度的特征。

MSE

MFP

高效上下文解耦头(ECDD)

结构:通过 SBM 和 1×1 卷积层将输入预测特征图解耦为两个分支,分别用于分类和回归任务。

损失函数:使用变量焦点损失(VFL)来实现正负样本的不对称加权,强调正样本;使用完整交并比(CIOU)损失函数来考虑边界框的纵横比;引入距离焦点损失(DFL)函数来快速聚焦网络到目标附近的位置。

实验

不同数据集不同模块引入实验

baseline:DarkNet53

不同数据集和其他模型对比实验

代表性检测结果

RSOD数据集对比网络实验

不同模块可视化提取效果

相关推荐
李子圆圆几秒前
电力设施通道防外破防异物实时监控预警装置的核心功能是什么
人工智能·语音识别
mit6.8246 分钟前
[Agent开发平台] API网关 | 业务领域 | DTO格式 | 分页令牌
人工智能·golang·状态模式
惜.己12 分钟前
appium中urllib3.exceptions.LocationValueError: No host specified. 的错误解决办法
网络·appium
吉凶以情迁24 分钟前
window服务相关问题探索 go语言服务开发探索调试
linux·服务器·开发语言·网络·golang
黎燃34 分钟前
工业机器人中的计算机视觉质检系统:从算法到产线落地的全流程指南
人工智能
vjmap36 分钟前
MCP协议:CAD地图应用的AI智能化解决方案(唯杰地图MCP)
前端·人工智能·gis
专注VB编程开发20年43 分钟前
UDP受限广播地址255.255.255.255的通信机制详解
网络·udp·智能路由器
一尘之中1 小时前
阿难尊者的末法时代“系统架构”之问
人工智能·系统架构·ai写作
潮湿的心情1 小时前
中宇联:以“智云融合+AI”赋能全栈云MSP服务,深化阿里云生态合作
人工智能·阿里云·云计算
云布道师1 小时前
【云故事探索】NO.16:阿里云弹性计算加速精准学 AI 教育普惠落地
人工智能·阿里云·云计算