计算机视觉中的NMS非极大值抑制

逆旅可好2024-03-30 22:19

NMS 是"非极大抑制"（Non-Maximum Suppression）的缩写，是一种在目标检测算法中广泛使用的技术。它的主要目的是减少目标检测过程中的多余的边界框，以便只保留最佳的一个边界框。

在目标检测任务中，算法会对图像中可能出现目标的区域进行评分，并为它们生成边界框。由于多个边界框可能覆盖到同一个目标，因此需要一个方法来选择最合适的边界框。NMS 通过以下步骤实现这一目的：

选择置信度最高的边界框（即目标存在的可能性最高的边界框）。
抑制与这个边界框高度重叠的所有其他边界框。具体来说，会计算这些边界框与置信度最高的边界框的交并比（IoU），如果IoU超过某个阈值（例如0.5），则这些边界框会被认为是对同一个目标的多余检测，并因此被抑制。
从剩下的边界框中再次选择置信度最高的边界框，重复上述过程，直到所有的边界框都被处理完毕。

通过NMS，我们可以确保每个目标只被检测一次，从而提高目标检测的准确性。这一技术在各种目标检测模型如YOLO、SSD、Faster R-CNN等中都有应用。