【CVPR26-韩国高丽大学】基于能量分离的开放世界目标检测未知目标方法


文章:Detecting Unknown Objects via Energy-based Separation for Open World Object Detection

代码:暂无

单位:韩国高丽大学、首尔国立大学


一、问题背景

传统目标检测是封闭集模式,只认识训练过的类别,遇到没见过的物体要么乱分类、要么直接忽略。

开放世界目标检测(OWOD) 要求模型做到三点:

  1. incremental 增量学习新类别

  2. 无监督识别出未知物体

  3. 用记忆回放缓解灾难性遗忘

但现有方法有两个致命问题:

  • 只靠已知类别判断未知,导致未知与背景/已知混淆,漏检严重

  • 记忆回放时新旧类别互相干扰,学新类就丢旧知识

二、方法创新

作者提出DEUS框架,核心由两个模块组成,简单好理解:

1. ETF子空间未知分离(EUS)

  • 等角紧框架(ETF) 把特征空间拆成已知空间未知空间

  • 同时计算两个空间的能量分数,让已知、未知、背景各归其位

  • 训练时强制拉开已知/未知的能量间隔,推理时校准未知分数

  • 解决:未知物体学不到特征、容易和背景混淆的问题

2. 基于能量的已知区分损失(EKD)

  • 把分类器拆成旧类别子分类器新类别子分类器

  • 用能量约束:旧样本只信旧分类器,新样本只信新分类器

  • 减少新旧知识互相干扰

  • 解决:记忆回放时学新忘旧的问题

总损失 = 分类损失 + 框回归损失 + EUS损失 + EKD损失(仅回放阶段用)

三、实验结果

DEUS在三大标准数据集M-OWODB、S-OWODB、RS-OWODB全面屠榜:

  • 未知召回率(U-Rec) 大幅领先,Task1最高冲到68.7%

  • 已知类别mAP 不掉点,增量学习全程稳定

  • 调和均值H-Score 所有任务均为SOTA

  • 计算开销极小:推理仅+1.9%,FLOPs仅+0.5%

可视化效果更直观:

  • 基线把长颈鹿(未知)误判成马,把牛(已知)判成未知

  • DEUS精准框出所有未知,正确识别已知,不漏检

四、优势与局限

优势

  1. 首次用双ETF子空间+能量建模未知特征,未知检测能力极强

  2. EKD损失完美解决记忆回放的新旧干扰问题

  3. 即插即用,基于MMDetection,轻量无负担

  4. 自然图像、遥感图像都能打,泛化性强

局限

  1. 已知与未知语义高度重叠时,分离效果会下降

  2. 伪标签质量依然依赖基础检测器的初始能力

五、一句话总结

DEUS用双空间能量分离 搞定未知检测,用新旧分类器解耦 解决灾难性遗忘,在开放世界目标检测上实现未知召回暴涨、已知精度不掉的SOTA效果,轻量好用、落地潜力拉满!

相关推荐
皮皮学姐分享-ppx14 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造
GIS数据转换器14 小时前
基于3D GIS的监控视频精准标定平台
人工智能·物联网·3d·音视频·无人机·知识图谱
专注VB编程开发20年14 小时前
AI 生成C# WinForm 窗体 = 目前就是垃圾
开发语言·人工智能·c#
深小乐14 小时前
Claude Fable5 尝鲜,效果挺不错
人工智能
Nayxxu14 小时前
Gemini + RAG 企业知识库教程:从文档切片到答案生成
运维·人工智能
冬奇Lab14 小时前
真正的 AI-Native Workflow 是什么?——四个判断测试
人工智能·agent
冬奇Lab15 小时前
每日一个开源项目(第128篇):Agent Skills - 给 AI 编程 Agent 装上工程纪律
人工智能·开源·资讯
Deepoch15 小时前
Deepoc VLA开发板:采摘机器人的环境鲁棒作业与不确定性应对
人工智能·机器人·采摘机器人·deepoc
云栖梦泽在15 小时前
AI安全专项:AI人脸识别的安全风险与防护
人工智能·安全