【CVPR26-韩国高丽大学】基于能量分离的开放世界目标检测未知目标方法


文章:Detecting Unknown Objects via Energy-based Separation for Open World Object Detection

代码:暂无

单位:韩国高丽大学、首尔国立大学


一、问题背景

传统目标检测是封闭集模式,只认识训练过的类别,遇到没见过的物体要么乱分类、要么直接忽略。

开放世界目标检测(OWOD) 要求模型做到三点:

  1. incremental 增量学习新类别

  2. 无监督识别出未知物体

  3. 用记忆回放缓解灾难性遗忘

但现有方法有两个致命问题:

  • 只靠已知类别判断未知,导致未知与背景/已知混淆,漏检严重

  • 记忆回放时新旧类别互相干扰,学新类就丢旧知识

二、方法创新

作者提出DEUS框架,核心由两个模块组成,简单好理解:

1. ETF子空间未知分离(EUS)

  • 等角紧框架(ETF) 把特征空间拆成已知空间未知空间

  • 同时计算两个空间的能量分数,让已知、未知、背景各归其位

  • 训练时强制拉开已知/未知的能量间隔,推理时校准未知分数

  • 解决:未知物体学不到特征、容易和背景混淆的问题

2. 基于能量的已知区分损失(EKD)

  • 把分类器拆成旧类别子分类器新类别子分类器

  • 用能量约束:旧样本只信旧分类器,新样本只信新分类器

  • 减少新旧知识互相干扰

  • 解决:记忆回放时学新忘旧的问题

总损失 = 分类损失 + 框回归损失 + EUS损失 + EKD损失(仅回放阶段用)

三、实验结果

DEUS在三大标准数据集M-OWODB、S-OWODB、RS-OWODB全面屠榜:

  • 未知召回率(U-Rec) 大幅领先,Task1最高冲到68.7%

  • 已知类别mAP 不掉点,增量学习全程稳定

  • 调和均值H-Score 所有任务均为SOTA

  • 计算开销极小:推理仅+1.9%,FLOPs仅+0.5%

可视化效果更直观:

  • 基线把长颈鹿(未知)误判成马,把牛(已知)判成未知

  • DEUS精准框出所有未知,正确识别已知,不漏检

四、优势与局限

优势

  1. 首次用双ETF子空间+能量建模未知特征,未知检测能力极强

  2. EKD损失完美解决记忆回放的新旧干扰问题

  3. 即插即用,基于MMDetection,轻量无负担

  4. 自然图像、遥感图像都能打,泛化性强

局限

  1. 已知与未知语义高度重叠时,分离效果会下降

  2. 伪标签质量依然依赖基础检测器的初始能力

五、一句话总结

DEUS用双空间能量分离 搞定未知检测,用新旧分类器解耦 解决灾难性遗忘,在开放世界目标检测上实现未知召回暴涨、已知精度不掉的SOTA效果,轻量好用、落地潜力拉满!

相关推荐
Freak嵌入式2 小时前
MicroPython LVGL基础知识和概念:底层渲染与性能优化
人工智能·python·单片机·性能优化·嵌入式·lvgl·micropython
大写-凌祁2 小时前
基于LLM智能体框架的城市遥感图像变化分析
人工智能·深度学习·计算机视觉·语言模型·aigc
kaikaile19952 小时前
移动机器人路径跟踪的设计与仿真:模型预测控制(MPC)详解
人工智能·stm32·嵌入式硬件·算法
人工智能AI技术2 小时前
AI Coding 工程化革命,Superpowers 管流程,ui-ux-pro-max 管质感
人工智能
ylatin2 小时前
常用的计算机视觉模型
人工智能·计算机视觉
沅_Yuan3 小时前
基于核密度估计的BP-KDE多输入单输出回归模型【MATLAB】
机器学习·matlab·回归·bp·核密度估计·kde
User_芊芊君子3 小时前
全能远控,性能为王:UU远程深度测评与行业横评
人工智能·dubbo·测评
刀法如飞3 小时前
关于AI的三个核心问题——工具、认知与产业的再思考
人工智能·aigc·ai编程