目标检测后的图像上绘制边界框和标签

效果如图所示,有个遗憾就是CV2在图像上显示中文有点难,也不想用别的了,所以改成了英文,代码在下面了,一定要注意一点,就是标注文件的读取一定要根据自己的实际情况改一下,我的所有图像的标注文件是一个XML文件。

python 复制代码
import cv2
import os
import numpy as np

def draw_label_type(draw_img,bbox,label_color):
    label = str(bbox[-1])
    labelSize = cv2.getTextSize(label + '0', cv2.FONT_HERSHEY_SIMPLEX, 0.5, 2)[0]
    if bbox[1] - labelSize[1] - 3 < 0:
        # 在图像上绘制边界框
        cv2.rectangle(draw_img,
                      (bbox[0], bbox[1] + 2),
                      (bbox[0] + labelSize[0], bbox[1] + labelSize[1] + 3),
                      color=label_color,
                      thickness=-1
                      )

        # 在图像中的边界框中打上标签
        cv2.putText(draw_img, label,
                    (bbox[0], bbox[1] + labelSize[1] + 3),
                    cv2.FONT_HERSHEY_SIMPLEX,
                    0.5,
                    (0, 0, 0),
                    thickness=1
                    )
    else:
        # 在图像上绘制边界框
        cv2.rectangle(draw_img,
                      (bbox[0], bbox[1] - labelSize[1] - 3),
                      (bbox[0] + labelSize[0], bbox[1] - 3),
                      color=label_color,
                      thickness=-1
                      )

        # 在图像中的边界框中打上标签
        cv2.putText(draw_img, label,
                    (bbox[0], bbox[1] - 3),
                    cv2.FONT_HERSHEY_SIMPLEX,
                    0.5,
                    (0, 0, 0),
                    thickness=1
                    )
    cv2.rectangle(draw_img, (bbox[0], bbox[1]), (bbox[2], bbox[3]), color=label_color, thickness=1)
    return draw_img

# 读取标注文件
def read_data(data_name):
    image_label=[]
    with open(data_name, 'r') as f:
        for line in f:
            image_label.append(line)
    return image_label

def spli_lab(word):
    labs = []
    while (len(word) > 10):
        tem = [int(word[-9]),int(word[-8]),int(word[-5]),int(word[-4]),word[-1]]
        labs.append(tem)
        word = word[:-10]
    return labs

def img_ann_ply(label):
    for lab in label:
        word = lab.split()
        #获取一张图象中的标签及位置
        # !!!!!怎们分离需要根据自己存储格式改变
        img_box = spli_lab(word)
        img_name = word[0][:-2]
        # 图像文件存储为.bmp。这里因为发现有的标间存储有bug设置了一个筛选
        if img_name[-1] != 'p':
            img_name = img_name[:-1]
        image = os.path.join(inputPath, img_name)
        # img = cv2.imread(image)
        img = cv2.imdecode(np.fromfile(image, dtype=np.uint8), -1)
        # 根据数据集中缺陷的不同设置边界框的颜色
        for box in img_box:
            if box[-1] == '"虫烂"':
                box_color = (255, 0, 0)
                box[-1] = 'Insect rot'
            elif box[-1] == '"内皮"':
                box_color = (0, 0, 255)
                box[-1] = 'endothelium'
            else:
                box_color = (0, 255, 0)
                box[-1] = 'charring'

            img = draw_label_type(img, box, box_color)

        #展示图像
        cv2.imshow("banliquexain", img)
        # 延时显示,如果想要键盘控制窗口的切换可将int数字改成0
        cv2.waitKey(60)
        #为了使窗口变得连续,我们将窗口销毁注销
        # cv2.destroyAllWindows()

if __name__ == '__main__':
    inputPath = r"F:\project\*****\datasets_2000"
    dataset_root = r"F:\project\**\datasets_2000\DetectTrainData.txt"
    # 读取标注文件,注意!!!!!!
    # 这里的标注文件读取会因文件存储格式不同需要自己改动
    label=read_data(data_name=dataset_root)

    #把标注文件中每张图像分别标注并显示
    img_ann_ply(label)
相关推荐
千匠网络12 小时前
破局出海壁垒,千匠网络新能源汽车跨境出海解决方案
人工智能
马丁聊GEO14 小时前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker14 小时前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.14 小时前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑14 小时前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
深海鱼在掘金14 小时前
深入浅出 LangChain —— 第三章:模型抽象层
人工智能·langchain·agent
生信碱移14 小时前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
workflower14 小时前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
GitCode官方15 小时前
基于昇腾 MindSpeed LLM 玩转 DeepSeekV4-Flash 模型的预训练复现部署
人工智能·开源·atomgit
大刘讲IT15 小时前
AI重塑企业信息价值标准:从“系统供给”到“用户定义”的企业数字化新范式
人工智能·经验分享·ai·制造