伪装目标检测论文阅读之:《Confidence-Aware Learning for Camouflaged Object Detection》

论文地址:link

code:link
摘要

任意不确定性捕获了观测结果中的噪声。对于伪装目标检测,由于伪装前景和背景的外观相似,很难获得高精度的注释,特别是目标边界周围的注释。我们认为直接使用"嘈杂"的伪装图进行训练可能会导致模型泛化能力较差。在本文中,我们引入了一种明确的任意不确定性估计技术来表示由于噪声标签而导致的预测不确定性。具体来说,我们提出了一种具有置信度的伪装目标检测(COD)框架,使用动态监督来生成准确的伪装图和可靠的"任意不确定性"。与根据点估计管道产生确定性预测的现有技术不同,我们的框架将任意不确定性形式化为模型输出和输入图像上的概率分布。我们声称,一旦经过训练,我们的置信度估计网络就可以评估预测的像素精度,而无需依赖地面真实伪装图。广泛的结果说明了所提出的模型在解释伪装预测方面的优越性能。

1.模型结构图


上图是fusion融合模块,利用到了RCAB结构,关于RCAB我在之前的论文阅读中有发,是一个固定的残差通道注意力模块。

2.方法

模型一共分为两个模块,COD和OCE模块,OCE模块较为简单,是说在U-Net的基础上,融合高层和浅层特征,COD比较复杂,涉及到 f θ r e f f_\theta ^{ref} fθref和 f θ i n i f_\theta^{ini} fθini
C n U = D ( C o n v 3 ( C o n v 3 ( C n − 1 D ) ) ) C_n^U = D(Conv3(Conv3(C_{n - 1}^D))) CnU=D(Conv3(Conv3(Cn−1D)))
C n U = D ( C o n v 3 ( C o n v 3 ( ∐ ( C n D , D ( T C o n v 2 ( C n + 1 U ) ) ) ) ) ) C_{\rm{n}}^U = D(Conv3(Conv3(\coprod (C_n^D,D(TConv2(C_{n + 1}^U)))))) CnU=D(Conv3(Conv3(∐(CnD,D(TConv2(Cn+1U))))))

重要结构:

动态置信监督:

为置信度估计网络引入动态监督 ,定义如下:
y c = y × ( 1 − y ^ ) + ( 1 − y ) × y ^ {y_c} = y \times (1 - \hat y) + (1 - y) \times \hat y yc=y×(1−y^)+(1−y)×y^

置信估计网络:
l c = 0.5 × ( l c e ( c i n i , y i n i ) + l c e ( c r e f , y r e f ) ) {l_c} = 0.5 \times ({l_{ce}}({c^{ini}},{y^{ini}}) + {l_{ce}}({c^{ref}},{y^{ref}})) lc=0.5×(lce(cini,yini)+lce(cref,yref))

置信感知学习:

伪装目标检测在整个图像中具有不同的学习难度,沿着对象边界的像素比远离伪装对象的背景像素更难区分,此外,迷彩前景包含不同程度迷彩的部分,其中一些部分很容易识别,例如,眼睛嘴巴等,还有一些很难区分的,例如主体区域和背景具有相似的背景外观,我们打算通过将估计的置信度图导入我们的伪装对象检测网络来对图像中这种不同的学习难度来进行建模,具体来说,受【47】的启发,建议使用置信感知结构损失来训练伪装目标检测网络,其在等式中定义:
l s = ∑ u , v w u , v l c e + ∑ u , v w u , v l d i c e {l_s} = \sum\limits_{u,v} {{w^{u,v}}{l_{ce}}} + \sum\limits_{u,v} {{w^{u,v}}{l_{dice}}} ls=u,v∑wu,vlce+u,v∑wu,vldice

3.结论

我们引入了一种用于伪装物体检测的在线不确定性估计技术,任意不确定性建模的传统方法仅涉及对任务相关损失函数的监督,如方程式3所示,在本文中,我们处理在线任意不确定性估计,并对任意不确定性估计模块引入动态监督以突出错误性的区域,具体来说,我们的框架由相互依赖的伪装对象检测网络和在线置信度估计网络组成。生成动态网络置信度标签来训练OCENet,该标签源自CODNet和地面实况图的预测。OCENet估计的置信图指示CODNet更加重视预测不确定的学习区域。我们提出的网络在四个基准伪装物体检测测试数据集上的表现由于现有的伪装物体检测方法,此外,生成的置信图提供了一种有效地解决方案来解释模型预测,而无需依赖地面实况图

相关推荐
六边形战士DONK7 分钟前
[强化学习基础05-2] 压缩映射定理
人工智能
weisian15113 分钟前
入门篇--知名企业-18-阿里巴巴-6--DashScope(灵积):从新手入门到企业落地,推开AI普惠之门,让智能触手可及
人工智能·阿里云·dashscope·灵积平台
2401_8414956418 分钟前
【DeepSeek系列】论文《mHC: Manifold-Constrained Hyper-Connections》全流程复现详解(附Python代码)
人工智能·pytorch·python·深度学习·论文复现·deepseek·mhc模型
万俟淋曦22 分钟前
【论文速递】2025年第47周(Nov-16-22)(Robotics/Embodied AI/LLM)
人工智能·机器学习·机器人·大模型·论文·robotics·具身智能
风途知识百科24 分钟前
太阳能杀虫灯——风吸式物联网杀虫灯
大数据·人工智能·物联网
xinxiangwangzhi_27 分钟前
多视图几何--密集匹配--ACMM
图像处理·计算机视觉
helloworld也报错?28 分钟前
深度强化学习(1)——基础知识(名词解释,概率论基础,蒙特卡洛采样,马尔可夫决策过程)
人工智能·深度学习·机器学习·概率论
小白学大数据29 分钟前
未来趋势:AI 时代下 python 爬虫技术的发展方向
运维·人工智能·爬虫·python·自动化
dagouaofei30 分钟前
2026 年年度工作计划 PPT:AI 自动生成方案横向对比
人工智能·python·powerpoint
龙腾AI白云36 分钟前
10分钟了解向量数据库(1)
人工智能·神经网络