【论文阅读】

作者提出了两个问题:"水下图像增强是否真的可以提高水下目标检测?

"水下图像增强如何有助于提高水下目标检测?

检测水下物体具有挑战性。最大的障碍是,原始水下图像通常具有低质量,如低对比度、低亮度、颜色偏差、模糊细节、不均匀的亮点等。这些降质问题主要是由后向散射、光选择性吸收和水中的散射引起的。

这篇文章的主要贡献可以概括为三个方面。

  1. 进行了第一次全面实证研究,研究水下图像增强对目标检测的影响。
  2. 通过广泛的实验和分析,揭示了现有水下图像增强算法的不足之处,包括其有限的鲁棒性和适应性,尤其是在水下目标检测方面。
  3. 分析了现有水下图像质量评估指标的局限性,这些指标不仅与人类视觉感知存在差距,而且无法直接代表后续高级任务(例如目标检测)的性能。
第一部分研究

探讨水下图像增强是否以及如何有助于目标检测。首先,我们描述了实验设置。其次,对水下目标检测的预处理结果进行定性和定量分析。第三,报告了采用不同水下图像增强算法增强后的结果对不同目标检测器进行再训练的实验结果,并对实验结果进行了定量和定性分析。

特别是使用计算和评估目标检测对整体性能影响的通用工具箱TIDE,以及特征图的可视化来分析水下图像增强对目标检测的影响。

得到结论:

  1. 颜色偏差不是影响目标检测的核心干扰;
  2. 基于良好的人眼视觉感知增强可能并不利于检测器;
  3. 当前的客观水下图像增强评估指标无法反映后续目标检测的性能

得到推断:

  1. 边缘可以严重影响检测器性能,因此增强算法需要保留图像的边缘信息;
  2. 由水下图像增强引入的颜色偏差可能会导致域的不连续性,从而降低检测器性能;
  3. 噪声可以降低检测器性能,这表明在增强水下图像时应避免引入额外的噪声;
  4. 对比度对目标检测的影响较小,但颜色丰富度和饱和度会影响检测器。

第二部分研究

在本文中,作者进行实证研究,以探究水下图像增强对水下目标检测的影响。作者选择了18种经典和最近的水下图像增强算法来预处理水下目标检测数据集,并将增强后的数据应用于重新训练7种基于深度学习的检测器。通过上述实验,作者获得了几个有趣的观察结果和见解:

  • 水下图像增强的一个最显著的发现是,水下图像增强抑制了目标检测的性能。尤其是,它抑制了检测器检测硬案例的能力,因为图像增强可能会增加背景的干扰。
  • 通过改变检测器Backbone和训练计划,作者进一步发现,提高网络特征提取能力并不能减少水下图像增强对水下目标检测的负面影响。
  • 尽管水下图像增强可以解决水下图像的降质问题,并获得具有更好视觉感知的图像,但它也会引入其他质量降质问题,这些降质问题会对水下目标检测产生影响。
  • 水下颜色偏差并不是影响目标检测的核心干扰,但是增强引入的多种颜色会影响检测器的性能。
  • 水下图像增强可能会引入噪声干扰、边缘模糊和纹理破坏问题,这些问题严重损害了检测器的性能。
  • 过度处理图像属性(对比度、饱和度和颜色丰富度)也可能导致检测器性能下降,其中饱和度和颜色问题是最影响检测器性能的因素。
  • 实验表明现有水下图像质量评估指标存在局限性,不仅与人类视觉感知存在差距,而且无法直接代表后续高级任务的性能。

这些发现可以推广到雾气图像、运动模糊图像、低分辨率图像和高质量图像的目标检测。因此,作者为未来的研究方向提供了展望

  • 对于图像增强,增强算法应该具有更好的泛化能力,以避免引入其他颜色偏差和噪声,并应故意实现图像增强,例如减少背景引起的干扰。
  • 对于增强评价指标,它应该不仅考虑人类视觉的视觉特性,还要满足机器提取的图像特征的要求。
  • 对于低质量图像目标检测,它应该设计为提高检测器的性能,并结合图像增强的优势,例如同时应用图像增强和目标检测。作者将继续探索如何设计任务导向的降质图像增强2和评价指标,以及降质图像增强和目标检测的联合应用的未来。
相关推荐
gogoMark4 小时前
口播视频怎么剪!利用AI提高口播视频剪辑效率并增强”网感”
人工智能·音视频
2201_754918414 小时前
OpenCV 特征检测全面解析与实战应用
人工智能·opencv·计算机视觉
love530love5 小时前
Windows避坑部署CosyVoice多语言大语言模型
人工智能·windows·python·语言模型·自然语言处理·pycharm
985小水博一枚呀6 小时前
【AI大模型学习路线】第二阶段之RAG基础与架构——第七章(【项目实战】基于RAG的PDF文档助手)技术方案与架构设计?
人工智能·学习·语言模型·架构·大模型
白熊1886 小时前
【图像生成大模型】Wan2.1:下一代开源大规模视频生成模型
人工智能·计算机视觉·开源·文生图·音视频
weixin_514548896 小时前
一种开源的高斯泼溅实现库——gsplat: An Open-Source Library for Gaussian Splatting
人工智能·计算机视觉·3d
四口鲸鱼爱吃盐6 小时前
BMVC2023 | 多样化高层特征以提升对抗迁移性
人工智能·深度学习·cnn·vit·对抗攻击·迁移攻击
Echo``7 小时前
3:OpenCV—视频播放
图像处理·人工智能·opencv·算法·机器学习·视觉检测·音视频
Douglassssssss7 小时前
【深度学习】使用块的网络(VGG)
网络·人工智能·深度学习
okok__TXF7 小时前
SpringBoot3+AI
java·人工智能·spring