【计算机视觉前沿研究 热点 顶会】CVPR 2024中与域适应、分布外目标检测相关的论文

测试时间线性分布外检测

分布外( OOD)检测旨在通过在输入样本显著偏离训练分布(分布中)时触发警报来解决神经网络的过度置信度预测,这表明输出可能不可靠。当前的 OOD 检测方法探索各种线索来识别 OOD 数据,例如在特征空间 logit 空间梯度空间或原始图像空间中发现不规则模式。令人惊讶的是,我们在几个数据集上观察到当前 OOD 检测算法产生的 OOD 分数与网络特征之间的线性趋势。我们从理论和经验上进行了深入的研究,以分析和理解 OOD 检测中这种线性趋势的含义。本文提出了一种鲁棒测试时间线性方法(RTL),当我们有一批数据来执行 OOD 检测时,可以像"免费午餐"一样利用这种线性趋势。

CORES:基于卷积响应的分布外检测分数

深度神经网络( DNN)在遇到分布外( OOD)样本时往往表现出过度自信,这在现实世界的应用中带来了重大挑战。利用卷积核上的响应对于分布内( ID)样本通常比 OOD 样本更明显的观察结果,本文提出了基于卷积核响应的分数(CORES)来利用这些差异进行 OOD 检测。

房间里的一只吵闹的大象:您的分布外检测器对标记噪音是否稳健?

检测不熟悉或意外图像的能力对于计算机视觉系统的安全部署至关重要。在分类的背景下,检测模型训练域之外的图像的任务称为分布外(OOD)检测。虽然人们对开发后自组织 OOD 检测方法的研究兴趣越来越大,但对于这些方法在底层分类器没有在干净、精心挑选的数据集上进行训练时如何执行的讨论相对较少。在这项工作中,我们在(更现实的)场景中更仔细地研究了 20 种最先进的 OOD 检测方法,其中用于训练底层分类器的标签是不可靠的(例如,众包标签或网络抓取的标签)。

用于小样本分布外检测的类似 ID 的提示学习

分布外(OOD)检测方法通常利用辅助离群点来训练识别 OOD 样本的模型,特别是从辅助离群点数据集中发现具有挑战性的离群点来改进 OOD 检测。然而,在有效区分与分布内(ID)数据非常相似的最具挑战性的 OOD 样本(即类似 ID 的样本)方面,它们可能仍然面临限制。为此,我们提出了一种新颖的 OOD 检测框架,该框架利用 ID 样本的邻近空间中的 CLIP 来发现类似 ID 的离群点,从而帮助识别这

些最具挑战性的 OOD 样本。

YolOOD:利用目标检测概念进行多标签分发外检测

由于分布外(OOD)检测在已部署系统中的重要性,近年来引起了机器学习研究界的广泛关注。以往的研究大多集中在多类分类任务中 OOD 样本的检测。然而,在多标签分类任务中的 OOD 检测,一个更常见的真实世界用例,仍然是一个未被探索的领域。在本研究中,我们提出了一种利用目标检测领域的概念来进行多标签分类任务中的 OOD 检测的方法 YolOOD。

用于分布外检测的辨别性驱动通道选择

分布外(OOD)检测对于在开放世界环境中部署机器学习模型至关重要。基于激活的方法是 OOD 检测中的关键方法,致力于减轻对 OOD 数据的过度自信预测。这些技术纠正了异常激活,提高了分布内(ID)数据和 OOD 数据之间的可区分性。然而,它们默认假设每个通道都是 OOD 检测和纠正每个通道中的异常激活所必需的。经验证据表明,不同的信道在 OOD 检测中存在着显着的差异,丢弃部分通道可以大大提高 OOD 检测的性能。

改进单域广义目标检测:关注多元化和对齐

在这项工作中,我们解决了用于目标检测的域泛化问题,特别是在只有一个源域可用的情况下。我们提出了一种有效的方法,包括两个关键步骤:源域的多样化和基于类预测置信度和局部化的检测对齐。

通过样本感知模型选择增强 OOD 检测的能力

在这项工作中,我们提出了一种新的视角来检测分布外(OOD)的样本,并提出了一种样本感知模型选择算法来提高 OOD 检测的有效性。我们的算法为每个测试输入确定模型动物园中的哪些预先训练的模型能够将测试输入识别为 OOD 样本。如果模型动物园中不存在这样的模型,则测试输入被归类为分布内(ID)样本。理论证明,当模型动物园中有足够数量的不同预训练模型时,我们的方法保持了 ID 样本的真实正确率,并以高概率准确识别 OOD 样本。

用于单源域广义对象检测的无偏Faster R-CNN

目标检测的单源域泛化(SDG)是一项具有挑战性的基本任务,因为不可见域的分布偏差会显著降低算法的性能。然而,现有的方法试图提取领域不变的特征,而忽略了有偏差的数据会导致网络学习无因果且泛化能力差的有偏差的特征。为此,我们提出了一种用于泛化特征学习的无偏Faster R-CNN(UFR)。

通过零镜头昼夜域自适应增强对象检测

在弱光场景中检测对象是一个持续的挑战,因为在光照良好的数据上训练的检测器由于能见度低而在弱光数据上表现出显著的性能下降。以前的方法通过使用真实的微光图像数据集探索图像增强或目标检测技术来缓解这一问题。然而,由于采集和标注微光图像的固有困难,这一进展受到了阻碍。为了应对这一挑战,我们提出了通过零镜头昼夜域自适应来提高微光目标检测的能力,其目的是将探测器从强光场景推广到微光场景,而不需要真正的微光数据。

CVPR 2024论文合集PDF版

由于判断依据的差异,这篇博客可能无法全面地囊括您需要的论文。

下面的资料中收录并翻译了CVPR 2024所有论文的题目与摘要,它为您扫清了语言障碍,让您能够充分地利用碎片时间、随时随地跟踪计算机视觉与模式识别领域最前沿的研究。

CVPR 2024 收录所有论文题目和题目的合集:https://mbd.pub/o/bread/ZpeYmplt

CVPR 2024 收录所有论文题目的合集:https://mbd.pub/o/bread/ZpeYmphy

相关推荐
sp_fyf_202428 分钟前
【大语言模型】ACL2024论文-19 SportsMetrics: 融合文本和数值数据以理解大型语言模型中的信息融合
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
CoderIsArt31 分钟前
基于 BP 神经网络整定的 PID 控制
人工智能·深度学习·神经网络
开源社44 分钟前
一场开源视角的AI会议即将在南京举办
人工智能·开源
FreeIPCC1 小时前
谈一下开源生态对 AI人工智能大模型的促进作用
大数据·人工智能·机器人·开源
机器之心1 小时前
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
人工智能·后端
z千鑫1 小时前
【人工智能】PyTorch、TensorFlow 和 Keras 全面解析与对比:深度学习框架的终极指南
人工智能·pytorch·深度学习·aigc·tensorflow·keras·codemoss
EterNity_TiMe_1 小时前
【论文复现】神经网络的公式推导与代码实现
人工智能·python·深度学习·神经网络·数据分析·特征分析
机智的小神仙儿1 小时前
Query Processing——搜索与推荐系统的核心基础
人工智能·推荐算法
AI_小站1 小时前
RAG 示例:使用 langchain、Redis、llama.cpp 构建一个 kubernetes 知识库问答
人工智能·程序人生·langchain·kubernetes·llama·知识库·rag
Doker 多克1 小时前
Spring AI 框架使用的核心概念
人工智能·spring·chatgpt