入选TPAMI2025!傅里叶变换+目标检测新突破!

今天给大家推荐一个目标检测,好发不卷的新思路:与傅里叶变换结合!

一方面,不仅能提升检测的准确性和可靠性,还能增强模型的通用性和适应性,灵活应对复杂场景。比如TPAMI25的FSD模型,便通过该方法,性能远超SOTA。CVPR24的SFS-CNet则实现了FLOPs直降75%的效果!主要在于:傅里叶变换能够分析信号的频率成分,将信号从时域转换到频域,从而提取出与目标相关而时域中难以捕捉的特征;且还能可以帮助模型区分信号和噪声在频域中的表现,抑制噪声!

另一方面,傅里叶变化能够与多种深度学习技术(CNN等)结合,方便我们根据目标任务设计模型,可发挥空间很大。且以往该思路用的还不算多!

为让大家能够紧跟前沿,掌握傅里叶变换+目标检测的主流研究思路,我给大家准备了10种创新思路和源码!

论文原文+开源代码需要的同学看文末

论文:Frequency-Guided Spatial Adaptation for Camouflaged Object Detection
内容

该论文提出了一种名为频率引导空间自适应网络(FGSA-Net)的新方法,用于伪装目标检测(COD)任务。该方法通过将预训练视觉基础模型(如Vision Transformer)的特征输入转换到频域,利用频率信息动态增强或减弱不同频率成分,从而自适应调整图像细节和轮廓特征的强度,能够突出有助于区分目标和背景的特征,并间接暗示伪装目标的位置和形状。

论文:Frequency-Spatial Entanglement Learning for Camouflaged Object Detection
内容

该论文提出了一种名为频率-空间纠缠学习(FSEL)的新方法,通过联合探索频率域和空间域的特征表示,引入了一系列精心设计的纠缠变换器模块、一个联合域感知模块、以及一个双域反向解析器,用于在频率和空间域中融合特征。ETB利用频率自注意力机制有效表征不同频率带之间的关系,并通过纠缠学习促进不同域特征之间的信息交互。

论文:Removal then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection
内容

该论文提出了一种名为"去除与选择检测器(RSDet)"的新型RGB-红外(IR)目标检测方法,旨在通过一种粗到细的融合策略来提高目标检测的性能。该方法受到人类大脑处理多模态信息机制的启发,设计了两个关键模块:冗余光谱去除(RSR)模块和动态特征选择(DFS)模块。RSR模块通过在频域中过滤掉冗余信息来粗略地去除干扰信息,而DFS模块则通过动态选择不同尺度的特征来精细地融合RGB和IR模态的特征。

论文:Generalizable Fourier Augmentation for Unsupervised Video Object Segmentation
内容

该论文提出了一种名为GFA的方法,用于提高无监督视频目标分割(UVOS)模型在分布外(Out-of-Distribution, OOD)测试样本上的泛化能力。GFA通过高斯采样生成多样化的风格特征来增强训练数据,并采用指数移动平均(EMA)策略在线更新相位特征,以学习跨域不变的特征,从而提高模型的泛化能力。

关注下方《人工智能学起来》

回复"傅目标"获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

相关推荐
Codebee2 小时前
能力中心 (Agent SkillCenter):开启AI技能管理新时代
人工智能
聆风吟º2 小时前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
uesowys2 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_56782 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子2 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
智驱力人工智能3 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_160144873 小时前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能
Howie Zphile3 小时前
全面预算管理难以落地的核心真相:“完美模型幻觉”的认知误区
人工智能·全面预算
人工不智能5773 小时前
拆解 BERT:Output 中的 Hidden States 到底藏了什么秘密?
人工智能·深度学习·bert
盟接之桥3 小时前
盟接之桥说制造:引流品 × 利润品,全球电商平台高效产品组合策略(供讨论)
大数据·linux·服务器·网络·人工智能·制造