弱监督目标检测:ALWOD: Active Learning for Weakly-Supervised Object Detection

论文作者:Yuting Wang,Velibor Ilic,Jiatong Li,Branislav Kisacanin,Vladimir Pavlovic

作者单位:Rutgers University;The Institute for Artificial Intelligence Research and Development of Serbia;Nvidia Corporation

论文链接:http://arxiv.org/abs/2309.07914v1

项目链接:https://github.com/seqam-lab/ALWOD

内容简介:

1)方向:目标检测(Object Detection)

2)应用:视觉任务中的目标检测

3)背景:目标检测在缺乏大规模训练数据集和准确的目标定位标签的情况下仍然存在挑战。

4)方法:本文提出了一种名为ALWOD的新框架,通过将主动学习(Active Learning)与弱监督和半监督目标检测范式相结合,解决了这个问题。首先,利用极小的标记集合和大量弱标记图像集合作为主动学习的初始状态,提出了一种新的辅助图像生成策略。然后,提出了一种新的主动学习获取函数,利用学生-教师目标检测对的不一致性和不确定性,有效地提出了最具信息量的图像进行注释。最后,为了完成主动学习循环,引入了一项新的标注任务,即基于模型提出的检测结果的选择和修正,这种方法在迅速而有效地标注信息丰富的图像方面表现出色。

5)结果:在几个具有挑战性的基准测试中,ALWOD显著缩小了仅基于部分标记但经过策略选择的图像实例进行训练的目标检测器与完全标记数据依赖的目标检测器之间的差距。代码可以在https://github.com/seqam-lab/ALWOD上公开获取。

相关推荐
User_芊芊君子1 小时前
AI Ping 深度评测:大模型 API 选型的 “理性决策中枢”,终结经验主义选型时代
人工智能
明天再做行么1 小时前
一些我用人工智能 翻译文章的心得
人工智能
晚霞的不甘7 小时前
小智AI音箱:智能语音交互的未来之选
人工智能·交互·neo4j
飞Link7 小时前
【网络与 AI 工程的交叉】多模态模型的数据传输特点:视频、音频、文本混合通道
网络·人工智能·音视频
老蒋新思维7 小时前
创客匠人峰会实录:知识变现的场景化革命 —— 创始人 IP 如何在垂直领域建立变现壁垒
网络·人工智能·tcp/ip·重构·知识付费·创始人ip·创客匠人
老蒋新思维7 小时前
创客匠人峰会深度解析:智能体驱动知识变现的数字资产化路径 —— 创始人 IP 的长期增长密码
人工智能·网络协议·tcp/ip·重构·知识付费·创始人ip·创客匠人
为爱停留8 小时前
Spring AI实现RAG(检索增强生成)详解与实践
人工智能·深度学习·spring
像风没有归宿a8 小时前
2025年人工智能十大技术突破:从AGI到多模态大模型
人工智能
深鱼~8 小时前
十分钟在 openEuler 上搭建本地 AI 服务:LocalAI 快速部署教程
人工智能