面试题-手撕NMS(非极大值抑制)

非极大值抑制(Non-Maximum Suppression,NMS)是一种常用于目标检测和计算机视觉中的算法,用于去除重叠的边界框,保留最可能是真实目标的边界框。

其核心就是对一组检测框,找出其中属于同一个类别且分数最高的那个框,然后把和这个框的IOU值大于阈值的那些框都删掉。

在NMS中,其实用到了计算IOU的方法,可以参考:面试题-手撕IOU计算

下面是代码:

cpp 复制代码
#include <iostream>
#include <vector>
#include <algorithm>

struct BoundingBox {
    float x1, y1, x2, y2;
    float score;
    int category;
};

bool compareScores(const BoundingBox& a, const BoundingBox& b) {
    return a.score > b.score; // 按照置信度分数降序排序
}

float intersectionArea(const BoundingBox& rect1, const BoundingBox& rect2) {
    float overlapWidth = std::max(0.0f, std::min(rect1.x2, rect2.x2) - std::max(rect1.x1, rect2.x1));
    float overlapHeight = std::max(0.0f, std::min(rect1.y2, rect2.y2) - std::max(rect1.y1, rect2.y1));

    return overlapWidth * overlapHeight;
}

float calculateIOU(const BoundingBox& rect1, const BoundingBox& rect2) {
    float area1 = (rect1.x2 - rect1.x1) * (rect1.y2 - rect1.y1);
    float area2 = (rect2.x2 - rect2.x1) * (rect2.y2 - rect2.y1);

    float intersection = intersectionArea(rect1, rect2);
    float unionArea = area1 + area2 - intersection;

    return intersection / unionArea;
}

std::vector<int> nms(const std::vector<BoundingBox>& bboxes, float threshold) {
    std::vector<int> keep;
    std::vector<bool> suppressed(bboxes.size(), false);

    std::vector<BoundingBox> sortedBBoxes = bboxes;
    std::sort(sortedBBoxes.begin(), sortedBBoxes.end(), compareScores);

    for (size_t i = 0; i < sortedBBoxes.size(); ++i) {
        if (suppressed[i]) continue;

        keep.push_back(i);

        for (size_t j = i + 1; j < sortedBBoxes.size(); ++j) {
            if (!suppressed[j] && sortedBBoxes[i].category == sortedBBoxes[j].category) {
                float iou = calculateIOU(sortedBBoxes[i], sortedBBoxes[j]);
                if (iou > threshold) {
                    suppressed[j] = true; // 标记重叠的边界框为已抑制
                }
            }
        }
    }

    return keep;
}

int main() {
    std::vector<BoundingBox> bboxes = {
        {10, 10, 50, 50, 0.9, 1},
        {20, 20, 60, 60, 0.85, 2},
        {30, 30, 70, 70, 0.95, 1},
        {40, 40, 80, 80, 0.75, 2}
    };

    float threshold = 0.5;
    std::vector<int> indices = nms(bboxes, threshold);

    std::cout << "Indices to keep after NMS: ";
    for (auto idx : indices) {
        std::cout << idx << " ";
    }
    std::cout << std::endl;

    return 0;
}
相关推荐
罗西的思考2 小时前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能·算法·机器学习
美团技术团队5 小时前
LongCat 开源 VitaBench 2.0:长期动态智能体基准新标杆
人工智能·算法
洛卡卡了5 小时前
我们在用 AI 写代码时,为什么建议要好好维护 AGENTS.md 呢?
面试·agent·claude
PBitW5 小时前
GPT训练我的第三天,明白了应该咋说满分回答!😕😕😕
前端·javascript·面试
自由路飞12 小时前
RAG 混合检索深挖:BM25 和向量分数为什么不能直接相加?
面试
用户8055336980312 小时前
不止三件套:QObject 属性系统全关键字与运行时反射!
c++·qt
未秃头的程序猿12 小时前
告别"if-else地狱"!Java 21模式匹配,代码优雅了10倍
java·后端·面试
RainCity12 小时前
Java Swing 自定义组件库分享(十二)
java·笔记·后端
To_OC1 天前
LC 207 课程表:刚学图论那会儿,我连这是拓扑排序都没看出来
javascript·算法·leetcode
To_OC1 天前
LC 208 实现 Trie 前缀树:曾被名字劝退,写完发现是送分题
javascript·算法·leetcode