【CVPR26-韩国高丽大学】基于能量分离的开放世界目标检测未知目标方法


文章:Detecting Unknown Objects via Energy-based Separation for Open World Object Detection

代码:暂无

单位:韩国高丽大学、首尔国立大学


一、问题背景

传统目标检测是封闭集模式,只认识训练过的类别,遇到没见过的物体要么乱分类、要么直接忽略。

开放世界目标检测(OWOD) 要求模型做到三点:

  1. incremental 增量学习新类别

  2. 无监督识别出未知物体

  3. 用记忆回放缓解灾难性遗忘

但现有方法有两个致命问题:

  • 只靠已知类别判断未知,导致未知与背景/已知混淆,漏检严重

  • 记忆回放时新旧类别互相干扰,学新类就丢旧知识

二、方法创新

作者提出DEUS框架,核心由两个模块组成,简单好理解:

1. ETF子空间未知分离(EUS)

  • 等角紧框架(ETF) 把特征空间拆成已知空间未知空间

  • 同时计算两个空间的能量分数,让已知、未知、背景各归其位

  • 训练时强制拉开已知/未知的能量间隔,推理时校准未知分数

  • 解决:未知物体学不到特征、容易和背景混淆的问题

2. 基于能量的已知区分损失(EKD)

  • 把分类器拆成旧类别子分类器新类别子分类器

  • 用能量约束:旧样本只信旧分类器,新样本只信新分类器

  • 减少新旧知识互相干扰

  • 解决:记忆回放时学新忘旧的问题

总损失 = 分类损失 + 框回归损失 + EUS损失 + EKD损失(仅回放阶段用)

三、实验结果

DEUS在三大标准数据集M-OWODB、S-OWODB、RS-OWODB全面屠榜:

  • 未知召回率(U-Rec) 大幅领先,Task1最高冲到68.7%

  • 已知类别mAP 不掉点,增量学习全程稳定

  • 调和均值H-Score 所有任务均为SOTA

  • 计算开销极小:推理仅+1.9%,FLOPs仅+0.5%

可视化效果更直观:

  • 基线把长颈鹿(未知)误判成马,把牛(已知)判成未知

  • DEUS精准框出所有未知,正确识别已知,不漏检

四、优势与局限

优势

  1. 首次用双ETF子空间+能量建模未知特征,未知检测能力极强

  2. EKD损失完美解决记忆回放的新旧干扰问题

  3. 即插即用,基于MMDetection,轻量无负担

  4. 自然图像、遥感图像都能打,泛化性强

局限

  1. 已知与未知语义高度重叠时,分离效果会下降

  2. 伪标签质量依然依赖基础检测器的初始能力

五、一句话总结

DEUS用双空间能量分离 搞定未知检测,用新旧分类器解耦 解决灾难性遗忘,在开放世界目标检测上实现未知召回暴涨、已知精度不掉的SOTA效果,轻量好用、落地潜力拉满!

相关推荐
美团技术团队17 小时前
美团跑腿 Skill:一句话,骑手来帮忙
人工智能
五度易链-区域产业数字化管理平台17 小时前
招商尽调报告自动化实战:五度妙笔AI模块的技术与场景解析
人工智能
Agent手记17 小时前
安全生产巡检全流程自动化与隐患预警方案:2026工业Agent落地实战指南
数据库·人工智能·安全·ai·自动化
SEO_juper17 小时前
语音搜索 GEO 优化,口语化英文短句布局玩法
人工智能·seo·geo·谷歌优化·2026·谷歌算法更新·口语化
szxinmai主板定制专家17 小时前
RK3568 + CODESYS+实时系统运动控制器PLC,支持 AI 视觉目标检测,预测性维护,混合多系统部署,多路模拟量采集
arm开发·人工智能·嵌入式硬件·fpga开发
大囚长17 小时前
自由能原理与预测处理的理论解析及其跨领域启示
人工智能·数学建模
Want59517 小时前
数字人场景落地:企业展厅 / 指挥大屏从展示到服务
人工智能·数字人
工业机器人销售服务17 小时前
伯朗特机器人集成智能料库,为多台激光切割机提供24小时不间断的板材上下料服务
人工智能
前端若水17 小时前
从零开始学习AI Agent的实战路线图
人工智能·学习
ting945200017 小时前
Vivago Video Agent 技术深度解析:大模型驱动的叙事视频全链路生成
人工智能·音视频