【CVPR26-韩国高丽大学】基于能量分离的开放世界目标检测未知目标方法


文章:Detecting Unknown Objects via Energy-based Separation for Open World Object Detection

代码:暂无

单位:韩国高丽大学、首尔国立大学


一、问题背景

传统目标检测是封闭集模式,只认识训练过的类别,遇到没见过的物体要么乱分类、要么直接忽略。

开放世界目标检测(OWOD) 要求模型做到三点:

  1. incremental 增量学习新类别

  2. 无监督识别出未知物体

  3. 用记忆回放缓解灾难性遗忘

但现有方法有两个致命问题:

  • 只靠已知类别判断未知,导致未知与背景/已知混淆,漏检严重

  • 记忆回放时新旧类别互相干扰,学新类就丢旧知识

二、方法创新

作者提出DEUS框架,核心由两个模块组成,简单好理解:

1. ETF子空间未知分离(EUS)

  • 等角紧框架(ETF) 把特征空间拆成已知空间未知空间

  • 同时计算两个空间的能量分数,让已知、未知、背景各归其位

  • 训练时强制拉开已知/未知的能量间隔,推理时校准未知分数

  • 解决:未知物体学不到特征、容易和背景混淆的问题

2. 基于能量的已知区分损失(EKD)

  • 把分类器拆成旧类别子分类器新类别子分类器

  • 用能量约束:旧样本只信旧分类器,新样本只信新分类器

  • 减少新旧知识互相干扰

  • 解决:记忆回放时学新忘旧的问题

总损失 = 分类损失 + 框回归损失 + EUS损失 + EKD损失(仅回放阶段用)

三、实验结果

DEUS在三大标准数据集M-OWODB、S-OWODB、RS-OWODB全面屠榜:

  • 未知召回率(U-Rec) 大幅领先,Task1最高冲到68.7%

  • 已知类别mAP 不掉点,增量学习全程稳定

  • 调和均值H-Score 所有任务均为SOTA

  • 计算开销极小:推理仅+1.9%,FLOPs仅+0.5%

可视化效果更直观:

  • 基线把长颈鹿(未知)误判成马,把牛(已知)判成未知

  • DEUS精准框出所有未知,正确识别已知,不漏检

四、优势与局限

优势

  1. 首次用双ETF子空间+能量建模未知特征,未知检测能力极强

  2. EKD损失完美解决记忆回放的新旧干扰问题

  3. 即插即用,基于MMDetection,轻量无负担

  4. 自然图像、遥感图像都能打,泛化性强

局限

  1. 已知与未知语义高度重叠时,分离效果会下降

  2. 伪标签质量依然依赖基础检测器的初始能力

五、一句话总结

DEUS用双空间能量分离 搞定未知检测,用新旧分类器解耦 解决灾难性遗忘,在开放世界目标检测上实现未知召回暴涨、已知精度不掉的SOTA效果,轻量好用、落地潜力拉满!

相关推荐
淡海水4 小时前
【AI模型】常见问题与解决方案
人工智能·深度学习·机器学习
HIT_Weston4 小时前
65、【Agent】【OpenCode】用户对话提示词(费米估算)
人工智能·agent·opencode
njsgcs4 小时前
我的知识是以图片保存的,我的任务状态可能也与图片有关,我把100张知识图片丢给vlm实时分析吗
人工智能
星爷AG I4 小时前
20-4 长时工作记忆(AGI基础理论)
人工智能·agi
#卢松松#5 小时前
用秒悟(meoo)制作了一个GEO查询小工具。
人工智能·创业创新
zandy10115 小时前
Agentic BI 架构实战:当AI Agent接管数据建模、指标计算与可视化全链路
人工智能·架构
数字供应链安全产品选型5 小时前
关键领域清单+SBOM:834号令下软件供应链的“精准治理“逻辑与技术落地路径
人工智能·安全
Flying pigs~~5 小时前
RAG智慧问答项目
数据库·人工智能·缓存·微调·知识库·rag
zuozewei5 小时前
从线下到等保二级生产平台:一次公有云新型电力系统 AI 部署复盘
人工智能
sanshanjianke5 小时前
AI辅助网文创作理论研究初步总结(一):AI辅助网文创作系统
人工智能·ai写作