【论文阅读】

作者提出了两个问题:"水下图像增强是否真的可以提高水下目标检测?

"水下图像增强如何有助于提高水下目标检测?

检测水下物体具有挑战性。最大的障碍是,原始水下图像通常具有低质量,如低对比度、低亮度、颜色偏差、模糊细节、不均匀的亮点等。这些降质问题主要是由后向散射、光选择性吸收和水中的散射引起的。

这篇文章的主要贡献可以概括为三个方面。

  1. 进行了第一次全面实证研究,研究水下图像增强对目标检测的影响。
  2. 通过广泛的实验和分析,揭示了现有水下图像增强算法的不足之处,包括其有限的鲁棒性和适应性,尤其是在水下目标检测方面。
  3. 分析了现有水下图像质量评估指标的局限性,这些指标不仅与人类视觉感知存在差距,而且无法直接代表后续高级任务(例如目标检测)的性能。
第一部分研究

探讨水下图像增强是否以及如何有助于目标检测。首先,我们描述了实验设置。其次,对水下目标检测的预处理结果进行定性和定量分析。第三,报告了采用不同水下图像增强算法增强后的结果对不同目标检测器进行再训练的实验结果,并对实验结果进行了定量和定性分析。

特别是使用计算和评估目标检测对整体性能影响的通用工具箱TIDE,以及特征图的可视化来分析水下图像增强对目标检测的影响。

得到结论:

  1. 颜色偏差不是影响目标检测的核心干扰;
  2. 基于良好的人眼视觉感知增强可能并不利于检测器;
  3. 当前的客观水下图像增强评估指标无法反映后续目标检测的性能

得到推断:

  1. 边缘可以严重影响检测器性能,因此增强算法需要保留图像的边缘信息;
  2. 由水下图像增强引入的颜色偏差可能会导致域的不连续性,从而降低检测器性能;
  3. 噪声可以降低检测器性能,这表明在增强水下图像时应避免引入额外的噪声;
  4. 对比度对目标检测的影响较小,但颜色丰富度和饱和度会影响检测器。

第二部分研究

在本文中,作者进行实证研究,以探究水下图像增强对水下目标检测的影响。作者选择了18种经典和最近的水下图像增强算法来预处理水下目标检测数据集,并将增强后的数据应用于重新训练7种基于深度学习的检测器。通过上述实验,作者获得了几个有趣的观察结果和见解:

  • 水下图像增强的一个最显著的发现是,水下图像增强抑制了目标检测的性能。尤其是,它抑制了检测器检测硬案例的能力,因为图像增强可能会增加背景的干扰。
  • 通过改变检测器Backbone和训练计划,作者进一步发现,提高网络特征提取能力并不能减少水下图像增强对水下目标检测的负面影响。
  • 尽管水下图像增强可以解决水下图像的降质问题,并获得具有更好视觉感知的图像,但它也会引入其他质量降质问题,这些降质问题会对水下目标检测产生影响。
  • 水下颜色偏差并不是影响目标检测的核心干扰,但是增强引入的多种颜色会影响检测器的性能。
  • 水下图像增强可能会引入噪声干扰、边缘模糊和纹理破坏问题,这些问题严重损害了检测器的性能。
  • 过度处理图像属性(对比度、饱和度和颜色丰富度)也可能导致检测器性能下降,其中饱和度和颜色问题是最影响检测器性能的因素。
  • 实验表明现有水下图像质量评估指标存在局限性,不仅与人类视觉感知存在差距,而且无法直接代表后续高级任务的性能。

这些发现可以推广到雾气图像、运动模糊图像、低分辨率图像和高质量图像的目标检测。因此,作者为未来的研究方向提供了展望

  • 对于图像增强,增强算法应该具有更好的泛化能力,以避免引入其他颜色偏差和噪声,并应故意实现图像增强,例如减少背景引起的干扰。
  • 对于增强评价指标,它应该不仅考虑人类视觉的视觉特性,还要满足机器提取的图像特征的要求。
  • 对于低质量图像目标检测,它应该设计为提高检测器的性能,并结合图像增强的优势,例如同时应用图像增强和目标检测。作者将继续探索如何设计任务导向的降质图像增强2和评价指标,以及降质图像增强和目标检测的联合应用的未来。
相关推荐
AI算法-图哥7 分钟前
pytorch量化训练
人工智能·pytorch·深度学习·文生图·模型压缩·量化
大山同学9 分钟前
DPGO:异步和并行分布式位姿图优化 2020 RA-L best paper
人工智能·分布式·语言模型·去中心化·slam·感知定位
机器学习之心10 分钟前
时序预测 | 改进图卷积+informer时间序列预测,pytorch架构
人工智能·pytorch·python·时间序列预测·informer·改进图卷积
天飓37 分钟前
基于OpenCV的自制Python访客识别程序
人工智能·python·opencv
檀越剑指大厂39 分钟前
开源AI大模型工作流神器Flowise本地部署与远程访问
人工智能·开源
声网42 分钟前
「人眼视觉不再是视频消费的唯一形式」丨智能编解码和 AI 视频生成专场回顾@RTE2024
人工智能·音视频
newxtc1 小时前
【AiPPT-注册/登录安全分析报告-无验证方式导致安全隐患】
人工智能·安全·ai写作·极验·行为验证
技术仔QAQ1 小时前
【tokenization分词】WordPiece, Byte-Pair Encoding(BPE), Byte-level BPE(BBPE)的原理和代码
人工智能·python·gpt·语言模型·自然语言处理·开源·nlp
陌上阳光1 小时前
动手学深度学习70 BERT微调
人工智能·深度学习·bert
正义的彬彬侠2 小时前
sklearn.datasets中make_classification函数
人工智能·python·机器学习·分类·sklearn