Python合并多个相交矩形框

Python合并多个相交矩形框

前言

前提条件

相关介绍

  • Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。

实验环境

  • Python 3.x (面向对象的高级语言)

Python合并多个相交矩形框

代码实现

python 复制代码
import cv2
import numpy as np


def xyxy2xywh(rect):
    '''
    (x1,y1,x2,y2) -> (x,y,w,h)
    '''
    return [rect[0],rect[1],rect[2]-rect[0],rect[3]-rect[1]]

def xywh2xyxy(rect):
    '''
    (x,y,w,h) -> (x1,y1,x2,y2)
    '''
    return [rect[0],rect[1],rect[0]+rect[2],rect[1]+rect[3]]


def is_RecA_RecB_interSect(RecA, RecB): # Rec = [xmin,ymin,xmax,ymax]
    # 获取交集区域的[xmin,ymin,xmax,ymax]
    x_A_and_B_min = max(RecA[0], RecB[0])
    y_A_and_B_min = max(RecA[1], RecB[1])
    x_A_and_B_max = min(RecA[2], RecB[2])
    y_A_and_B_max = min(RecA[3], RecB[3])
    # 计算交集部分面积, 当(xmax - xmin)为负时,说明A与B框无交集,直接置为0。 (ymax - ymin)同理。
    interArea = max(0, x_A_and_B_max - x_A_and_B_min) * max(0, y_A_and_B_max - y_A_and_B_min)
    return interArea > 0

def merge_RecA_RecB(RecA, RecB): # Rec = [xmin,ymin,xmax,ymax]
    # 获取合并区域的[xmin,ymin,xmax,ymax]
    xmin = min(RecA[0], RecB[0])
    ymin = min(RecA[1], RecB[1])
    xmax = max(RecA[2], RecB[2])
    ymax = max(RecA[3], RecB[3])
    return [xmin,ymin, xmax,ymax]

# def merge_rect(box,box_len):
#     if  box_len== 1:
#         return box

#     for i in range(box_len):
#         RecA_xywh = box[i]
#         RecA_xyxy = xywh2xyxy(RecA_xywh)
#         for j in range(i+1,box_len):
#             RecB_xywh = box[j]
#             RecB_xyxy = xywh2xyxy(RecB_xywh)
#             print(is_RecA_RecB_interSect(RecA_xyxy, RecB_xyxy))
#             if is_RecA_RecB_interSect(RecA_xyxy, RecB_xyxy):
#                 rect_xyxy = merge_RecA_RecB(RecA_xyxy, RecB_xyxy)
#                 rect_xywh = xyxy2xywh(rect_xyxy)
#                 box.remove(RecA_xywh)
#                 box.remove(RecB_xywh)
#                 box.append(rect_xywh)
#                 box_len = len(box)
#                 merge_rect(box,box_len)
#                 # 此处少了return box会报错
#     return box


# def merge_rect(box, box_len):
    
#     if box_len == 1:
#         return box

#     for i in range(box_len):
#         RecA_xywh = box[i]
#         RecA_xyxy = xywh2xyxy(RecA_xywh)
#         for j in range(i+1, box_len):
#             RecB_xywh = box[j]
#             RecB_xyxy = xywh2xyxy(RecB_xywh)
#             if is_RecA_RecB_interSect(RecA_xyxy, RecB_xyxy):
#                 rect_xyxy = merge_RecA_RecB(RecA_xyxy, RecB_xyxy)
#                 rect_xywh = xyxy2xywh(rect_xyxy)
#                 # 使用remove(elem)来移除元素
#                 box.remove(RecA_xywh)
#                 box.remove(RecB_xywh)

#                 box.append(rect_xywh)
#                 box_len = len(box)
#                 merge_rect(box, box_len)
#                 # 返回上一级循环,避免重复处理已合并的矩形
#                 return box
#     return box



'''
递归是一个过程或函数在其定义或说明中有直接或间接调用自身的一种方法,
它通常把一个大型复杂的问题层层转化为一个与原问题相似的规模较小的问题来求解。
因此递归过程,最重要的就是查看能不能讲原本的问题分解为更小的子问题,这是使用递归的关键。


    终止条件:矩形框数为1或者为空。
    返回值: 新合并的矩形框
    本级任务: 每一级需要做的就是遍历从它开始的后续矩形框,寻找可以和他合并的矩形

'''
def merge_rect(box):
    '''
    合并重叠框 

    输入参数: box :[[x,y,w,h],...]

    返回:
        合并后的box:[[x,y,w,h],...]
    '''
    if len(box) == 1 or len(box) == 0 : # 矩形框数为1或者为空
        return box

    for i in range(len(box)):
        RecA_xywh = box[i]
        RecA_xyxy = xywh2xyxy(RecA_xywh)
        for j in range(i+1, len(box)):
            RecB_xywh = box[j]
            RecB_xyxy = xywh2xyxy(RecB_xywh)
            if is_RecA_RecB_interSect(RecA_xyxy, RecB_xyxy):
                rect_xyxy = merge_RecA_RecB(RecA_xyxy, RecB_xyxy)
                rect_xywh = xyxy2xywh(rect_xyxy)
                # 使用remove(elem)来移除元素
                box.remove(RecA_xywh)
                box.remove(RecB_xywh)
                box.append(rect_xywh)
                merge_rect(box)
                # 返回上一级循环,避免重复处理已合并的矩形
                return box
    return box


if __name__=="__main__":
    # 原始
    box = [[256,256,10,10],[10,10,15,15],[20,20,10,10],[100,100,150,150],
           [200,200,100,100],[400,400,15,15],[410,410,15,15],[420,420,10,10]] # (x,y,w,h)
    print("原始的矩形框:",box)
    
    img = np.ones([512, 512, 3], np.uint8)
    for x,y,w,h in box:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (0, 255, 0), 2)
    cv2.imshow('origin', img)

    # 合并后
    merged_box =  merge_rect(box)
    print("合并的矩形框:",merged_box)

    img = np.ones([512, 512, 3], np.uint8) 
    for x,y,w,h in merged_box:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (0, 0, 255), 2)
    cv2.imshow('merged', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
相关推荐
未来之窗软件服务1 天前
幽冥大陆(八十七 ) 水果识别在线检测模型netron —东方仙盟练气期
人工智能·机器学习·ncnn·仙盟创梦ide·东方仙盟
村口曹大爷1 天前
[特殊字符] 2026年AI最新趋势深度解读:智能体崛起、多模态融合、全球竞速加剧
人工智能·ai
Elastic 中国社区官方博客1 天前
如何使用 LangChain 和 Elasticsearch 构建 agent 知识库
大数据·人工智能·elasticsearch·搜索引擎·ai·langchain·全文检索
zh_xuan1 天前
kotlin的常见空检查
android·开发语言·kotlin
星云数灵1 天前
大模型高级工程师考试练习题1
人工智能·大模型·大模型工程师·大模型考试题·大模型工程师练习题·大模型高频考题
草莓熊Lotso1 天前
Python 进阶核心:字典 / 文件操作 + 上下文管理器实战指南
数据结构·c++·人工智能·经验分享·笔记·git·python
天远Date Lab1 天前
Python实现用户消费潜力评估:天远个人消费能力等级API对接全攻略
java·大数据·网络·python
乐迪信息1 天前
乐迪信息:目标检测算法+AI摄像机:煤矿全场景识别方案
人工智能·物联网·算法·目标检测·目标跟踪·语音识别
学术小白人1 天前
【EI会议征稿通知】2026年智能感知与自主控制国际学术会议(IPAC 2026)
人工智能·物联网·数据分析·区块链·能源
HyperAI超神经1 天前
在线教程丨 David Baker 团队开源 RFdiffusion3,实现全原子蛋白质设计的生成式突破
人工智能·深度学习·学习·机器学习·ai·cpu·gpu