计算机视觉中的NMS非极大值抑制

NMS 是"非极大抑制"(Non-Maximum Suppression)的缩写,是一种在目标检测算法中广泛使用的技术。它的主要目的是减少目标检测过程中的多余的边界框,以便只保留最佳的一个边界框。

在目标检测任务中,算法会对图像中可能出现目标的区域进行评分,并为它们生成边界框。由于多个边界框可能覆盖到同一个目标,因此需要一个方法来选择最合适的边界框。NMS 通过以下步骤实现这一目的:

  1. 选择置信度最高的边界框(即目标存在的可能性最高的边界框)。

  2. 抑制与这个边界框高度重叠的所有其他边界框。具体来说,会计算这些边界框与置信度最高的边界框的交并比(IoU),如果IoU超过某个阈值(例如0.5),则这些边界框会被认为是对同一个目标的多余检测,并因此被抑制。

  3. 从剩下的边界框中再次选择置信度最高的边界框,重复上述过程,直到所有的边界框都被处理完毕。

通过NMS,我们可以确保每个目标只被检测一次,从而提高目标检测的准确性。这一技术在各种目标检测模型如YOLO、SSD、Faster R-CNN等中都有应用。

相关推荐
J_Xiong011716 分钟前
【LLMs篇】14:扩散语言模型的理论优势与局限性
人工智能·语言模型·自然语言处理
红衣小蛇妖1 小时前
神经网络-Day44
人工智能·深度学习·神经网络
忠于明白1 小时前
Spring AI 核心工作流
人工智能·spring·大模型应用开发·spring ai·ai 应用商业化
且慢.5892 小时前
Python_day47
python·深度学习·计算机视觉
大写-凌祁2 小时前
论文阅读:HySCDG生成式数据处理流程
论文阅读·人工智能·笔记·python·机器学习
Unpredictable2222 小时前
【VINS-Mono算法深度解析:边缘化策略、初始化与关键技术】
c++·笔记·算法·ubuntu·计算机视觉
柯南二号2 小时前
深入理解 Agent 与 LLM 的区别:从智能体到语言模型
人工智能·机器学习·llm·agent
珂朵莉MM2 小时前
2021 RoboCom 世界机器人开发者大赛-高职组(初赛)解题报告 | 珂学家
java·开发语言·人工智能·算法·职场和发展·机器人
IT_陈寒2 小时前
Element Plus 2.10.0 重磅发布!新增Splitter组件
前端·人工智能·后端