NMS算法实现

NMS算法(非极大值抑制)是目标检测算法中经典的后处理步骤,其本质是搜索局部最大值,抑制非极大值元素。主要利用目标检测框以及对应的置信度分数,设置一定的阈值来删除重叠较大的边界框。

其算法流程如下:

根据置信度得分进行排序

选择置信度最高的目标检测框添加到输出列表中,将其从检测框列表中删除

计算该检测框与剩余候选检测框的IOU

删除IOU大于阈值的检测框

重复上述4步,直至检测框列表为空

复制代码
import numpy as np


def nms(dets, thresh):  # x1, y1, x2, y2, score
    x1, y1, x2, y2, scores = dets[:, 0], dets[:, 1], dets[:, 2], dets[:, 3], dets[:, 4]
    areas = (x2 - x1 + 1) * (y2 - y1 + 1)  # 各个方框的面积
    order = scores.argsort()[::-1]  # 按置信度排序后的index, 作为候选集
    keep = []  # 保存筛选出来的方框的index
    while order.size > 0:

        i = order[0]  # 当前置信度最大的方框
        keep.append(i)
        xx1 = np.maximum(x1[i], x1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])

        w = np.maximum(0.0, (xx2 - xx1 + 1))
        h = np.maximum(0.0, (yy2 - yy1 + 1))
        inter = w * h  # 当前置信度最大的框和其他所有框的相交面积
        overlap = inter / (areas[i] + areas[order[1:]] - inter)
        inds = np.where(overlap <= thresh)[0]  # 交并比小于thresh的仍然保留在候选集里, 大的过滤掉
        order = order[inds + 1]  # inds + 1对应原来order中overlap小于thresh的项
    return keep


if __name__ == '__main__':
    detections = [
        [10, 20, 100, 100, 0.9],
        [20, 10, 110, 100, 0.88],
        [20, 20, 110, 110, 0.86],
        [40, 50, 200, 200, 0.95],
        [45, 52, 198, 202, 0.87]
    ]
    detections = np.array(detections)
    keeps = nms(detections, 0.5)
    print(detections[keeps])
相关推荐
檐下翻书17322 分钟前
从入门到精通:流程图制作学习路径规划
论文阅读·人工智能·学习·算法·流程图·论文笔记
CoderYanger34 分钟前
B.双指针——3194. 最小元素和最大元素的最小平均值
java·开发语言·数据结构·算法·leetcode·职场和发展·1024程序员节
小曹要微笑2 小时前
STM32各系列时钟树详解
c语言·stm32·单片机·嵌入式硬件·算法
前进的李工3 小时前
LeetCode hot100:094 二叉树的中序遍历:从递归到迭代的完整指南
python·算法·leetcode·链表·二叉树
麦麦大数据4 小时前
F049 知识图谱双算法推荐在线学习系统vue+flask+neo4j之BS架构开题论文全源码
学习·算法·知识图谱·推荐算法·开题报告·学习系统·计算机毕业设计展示
兩尛4 小时前
215. 数组中的第K个最大元素
数据结构·算法·排序算法
952364 小时前
数据结构-堆
java·数据结构·学习·算法
吃着火锅x唱着歌4 小时前
LeetCode 面试题 16.24.数对和
算法·leetcode·职场和发展
不会编程的小寒4 小时前
数据结构 2.0
数据结构·算法
专注VB编程开发20年4 小时前
图片转矢量图(提取轮廓线条)Potrace:一个基于多边形的位图轮廓矢量化算法(translation)
算法·图片转矢量