弱监督目标检测:ALWOD: Active Learning for Weakly-Supervised Object Detection

论文作者:Yuting Wang,Velibor Ilic,Jiatong Li,Branislav Kisacanin,Vladimir Pavlovic

作者单位:Rutgers University;The Institute for Artificial Intelligence Research and Development of Serbia;Nvidia Corporation

论文链接:http://arxiv.org/abs/2309.07914v1

项目链接:https://github.com/seqam-lab/ALWOD

内容简介:

1)方向:目标检测(Object Detection)

2)应用:视觉任务中的目标检测

3)背景:目标检测在缺乏大规模训练数据集和准确的目标定位标签的情况下仍然存在挑战。

4)方法:本文提出了一种名为ALWOD的新框架,通过将主动学习(Active Learning)与弱监督和半监督目标检测范式相结合,解决了这个问题。首先,利用极小的标记集合和大量弱标记图像集合作为主动学习的初始状态,提出了一种新的辅助图像生成策略。然后,提出了一种新的主动学习获取函数,利用学生-教师目标检测对的不一致性和不确定性,有效地提出了最具信息量的图像进行注释。最后,为了完成主动学习循环,引入了一项新的标注任务,即基于模型提出的检测结果的选择和修正,这种方法在迅速而有效地标注信息丰富的图像方面表现出色。

5)结果:在几个具有挑战性的基准测试中,ALWOD显著缩小了仅基于部分标记但经过策略选择的图像实例进行训练的目标检测器与完全标记数据依赖的目标检测器之间的差距。代码可以在https://github.com/seqam-lab/ALWOD上公开获取。

相关推荐
youcans_2 分钟前
【DeepSeek论文精读】13. DeepSeek-OCR:上下文光学压缩
论文阅读·人工智能·计算机视觉·ocr·deepseek
m0_650108244 分钟前
【论文精读】Latent-Shift:基于时间偏移模块的高效文本生成视频技术
人工智能·论文精读·文本生成视频·潜在扩散模型·时间偏移模块·高效生成式人工智能
岁月的眸23 分钟前
【循环神经网络基础】
人工智能·rnn·深度学习
文火冰糖的硅基工坊25 分钟前
[人工智能-大模型-35]:模型层技术 - 大模型的能力与应用场景
人工智能·神经网络·架构·transformer
m0_6501082432 分钟前
【 论文精读】VIDM:基于扩散模型的视频生成新范式
计算机视觉·扩散模型·视频生成·论文精读·隐式条件建模
GIS数据转换器1 小时前
2025无人机在农业生态中的应用实践
大数据·网络·人工智能·安全·无人机
syso_稻草人1 小时前
基于 ComfyUI + Wan2.2 animate实现 AI 视频人物换衣:完整工作流解析与资源整合(附一键包)
人工智能·音视频
qq_436962182 小时前
AI+BI工具全景指南:重构企业数据决策效能
人工智能·重构
sali-tec2 小时前
C# 基于halcon的视觉工作流-章48-短路断路
开发语言·图像处理·人工智能·算法·计算机视觉
cuicuiniu5212 小时前
浩辰CAD 看图王 推出「图小智AI客服」,重构设计服务新体验
人工智能·cad·cad看图·cad看图软件·cad看图王