【CVPR 2025】SET:Spectral Enhancement for Tiny Object Detection

论文作者:Huixin Sun, Runqi Wang, Yanjing Li

Linlin Yang, Shaohui Lin, Xianbin Cao, Baochang Zhang

发布期刊:CVPR

发布年份:2025

文章目录

  • 摘要
  • 论文创新点
  • 方法
    • [HBS(Hierarchical Background Smoothing)分层背景平滑处理](#HBS(Hierarchical Background Smoothing)分层背景平滑处理)
    • [API(Adversarial Perturbation Injection​)利用对抗扰动增强目标区域特征显著性](#API(Adversarial Perturbation Injection)利用对抗扰动增强目标区域特征显著性)
  • 实验
  • 结论

摘要

深度学习极大地推动了目标检测领域的发展。然而,小目标检测(TOD)仍然是一个具有挑战性的问题。本论文提供了一种新的分析方法,通过频域中基于遮挡的归因分析来研究TOD挑战。我们观察到,小目标在特征编码后变得不够清晰,并且可以从高频信息的移除中获益。在本文中,提出了一种名为小目标检测光谱增强(SET)的新方法,该方法在异构架构中放大小目标的频率特征。SET包含两个模块。分层背景平滑(HBS)模块通过自适应平滑操作抑制背景中的高频噪声。对抗性扰动注入(API)模块利用对抗性扰动来提高关键区域的特征显著性,并在训练过程中促进目标特征的细化。在四个数据集上的大量实验证明了方法的有效性。特别是,在AI-TOD数据集上,SET将现有技术RFLA的AP提升了3.2%。

论文创新点

  1. 从频谱角度进行了基于特征级遮挡的归因分析,以研究小目标检测(TOD)挑战,结果表明小目标更易受高频噪声影响。我们通过为前景和背景特征细化设计异构架构,引入了一种用于小目标检测的频谱增强方案(SET)。
  2. 为TOD任务设计了两个新模块。HBS模块通过自适应平滑操作抑制背景中的高频噪声。API模块利用对抗性扰动来提高关键区域的特征显著性,并在训练过程中促进对象特征的细化。
  3. 大量结果表明,我们的SET大幅提升了知名基线和现有技术的性能。

方法

上图为基于FCOS框架的所提SET方法概述。红色虚线表示生成对抗性扰动。HBS模块可通过尺度平滑操作抑制背景中的高频噪声。API模块利用对抗性扰动提高关键区域的特征显著性,并通过对抗训练促进鲁棒的特征表示。

HBS(Hierarchical Background Smoothing)分层背景平滑处理

论文发现:高频信息主要来自背景,如果直接删除高频信息,会损失目标边缘信息

因此作者提出:只对背景区域进行频谱平滑,以抑制高频噪声,同时保持目标区域的特征完整。

HBS的核心公式为:

其中 Pi 表示第 i 层FPN特征,Pi​∈RC×H×W,输出的 PiE 为增强后的特征。M为利用 GT bounding box 生成的二进制前景掩码,¬M为M的补集(1-M),M​∈R1×H×W

通过 mask 将特征分解为前景特征 Pifg 和背景特征 Pibg ,⊙表示逐元素乘法:

HBS的核心在于:

Fr​=WrPibg ​表示通道降维,输出 Fr​∈RrC/r×H×W,再使用 σ=ReLU 线性激活,最后进行通道恢复 We,最后加入残差链接

API(Adversarial Perturbation Injection​)利用对抗扰动增强目标区域特征显著性

API的核心公式:

Pi~~ L cls​ 代表 loss 对 feature 的梯度,分母部分表示L2 norm(仅保留方向),目的是将梯度归一化,ρ ∈ [0.1 , 1]为扰动强度,由公式计算出最终扰动 ϵi ,最后进行扰动加入特征:

​论文方法还加入了多任务扰动融合以及API辅助损失,公式依次如下:


实验

在AI-TOD数据集上使用不同框架的结果对比表格

MS COCO上的检测性能。注意,模型在COCO train2017上训练,并在COCO val2017上验证。

消融实验

结论

本文提出了一种用于小目标的频谱增强(SET)方法,该方法在异构架构中放大小目标的频率特征。SET包含两个模块。分层背景平滑(HBS)模块通过自适应平滑操作抑制背景中的高频噪声。对抗性扰动注入(API)模块利用对抗性扰动在训练过程中促进目标特征的细化。在四个数据集上进行的大量实验证明了其有效性。

相关推荐
大龄程序员狗哥18 分钟前
第25篇:Q-Learning算法解析——强化学习中的经典“价值”学习(原理解析)
人工智能·学习·算法
陶陶然Yay20 分钟前
神经网络常见层Numpy封装参考(5):其他层
人工智能·神经网络·numpy
极客老王说Agent25 分钟前
2026实战指南:如何用智能体实现药品不良反应报告的自动录入?
人工智能·ai·chatgpt
imbackneverdie29 分钟前
本科毕业论文怎么写?需要用到什么工具?
人工智能·考研·aigc·ai写作·学术·毕业论文·ai工具
lulu12165440781 小时前
Claude Code项目大了响应慢怎么办?Subagents、Agent Teams、Git Worktree、工作流编排四种方案深度解析
java·人工智能·python·ai编程
大橙子打游戏1 小时前
talkcozy像聊微信一样多项目同时开发
人工智能·vibecoding
deephub1 小时前
LangChain 还是 LangGraph?一个是编排一个是工具包
人工智能·langchain·大语言模型·langgraph
OidEncoder2 小时前
编码器分辨率与机械精度的关系
人工智能·算法·机器人·自动化
Championship.23.242 小时前
Harness工程深度解析:从理论到实践的完整指南
人工智能·harness
扬帆破浪2 小时前
开源免费的WPS AI 软件 察元AI文档助手:链路 002:executeAssistantFromRibbon 与任务进度窗
人工智能·开源·wps