【数据清洗】快速对目标检测标注数据进行分类筛选

关键词: python 、 xml、yolo、分类筛选、目标检测、 数据清洗、 脚本

背景

数据集的质量往往不是那么好,通常伴随着非目标物体的出现进行误标注,或者是需要已标注的数据集进行分类筛选。现在我们简化假设如下任务
主题: 对安全帽数据集进行清洗;
内容: 安全帽数据集中含有红色帽、蓝色帽、黄色帽这三种颜色;
需求: 对安全帽数据集标签都是helmet,现在需要对helmet分为三种颜色

需求分析

这里我们有三种颜色的帽子,但是标签都是helmet,现在需要将他们分开,然后重新修改name。我们可以通过脚本语言实现读取图像以及标签文件,将标签文件的标注信息绘制在读取图像上,按下指定按键将所显示的图像移动至指定文件夹中达到数据清洗的目的。

在这里对上述进行分析可以得到两个个关键点:

  1. 读取图像及对应的标注信息
  2. 监控键盘按键是否被按下

实现

这里我们使用python语言实现上述的两个核心功能在实现,这里我们使用opencv读取图像,然后读取该图像名对应的标注图像:

shell 复制代码
# 获取xml信息
def parse_xml(self, xml_file):
    tree = ET.parse(xml_file)
    root = tree.getroot()
    boxes = []

    for obj in root.findall('object'):
        name = str(obj.find('name').text)
        xmin = int(obj.find('bndbox').find('xmin').text)
        ymin = int(obj.find('bndbox').find('ymin').text)
        xmax = int(obj.find('bndbox').find('xmax').text)
        ymax = int(obj.find('bndbox').find('ymax').text)
        boxes.append((name, xmin, ymin, xmax, ymax))

    return boxes

def fun_1(self):
    global key_char
    img_path, xml_path = self.open_file()
    for name in os.listdir(img_path):
        self.img_name = name
        self.xml_name = name[:-3] + "xml"
        self.img_file = os.path.join(img_path, self.img_name)
        self.xml_file = os.path.join(xml_path, self.xml_name)

        image = cv2.imread(self.img_file)
        boxes = self.parse_xml(self.xml_file)
        for box in boxes:
            name, xmin, ymin, xmax, ymax = box
        cv2.rectangle(image, (xmin, ymin), (xmax, ymax), (255, 0, 0), 3)
        image = cv2.resize(image, (640, 480), interpolation=cv2.INTER_LINEAR)
        cv2.imshow('Image with Boxes', image)
        key = cv2.waitKey(0) & 0xFF

监控键盘按键是否被按下这里我们调用pynput库中的keyboard实现:

shell 复制代码
def on_key(self, key):
    global key_char
    key_char = key.char

def key_press(self):
    with keyboard.Listener(on_press=self.on_key) as listener:
        listener.join()

后续根据这两个核心功能,采用多线程使显示图像标注信息与按键监控逐步调试即可完成。

相关推荐
Cha0DD37 分钟前
【由浅入深探究langchain】第二十集-SQL Agent+Human-in-the-loop
人工智能·python·ai·langchain
Cha0DD38 分钟前
【由浅入深探究langchain】第十九集-官方的SQL Agent示例
人工智能·python·ai·langchain
阿拉斯攀登1 小时前
YOLO 视觉检测全栈核心名词指南:从训练调参到边缘部署,商用落地必懂
人工智能·yolo·计算机视觉·视觉检测·bytetrack
智算菩萨2 小时前
【Tkinter】4 Tkinter Entry 输入框控件深度解析:数据验证、密码输入与现代表单设计实战
python·ui·tkinter·数据验证·entry·输入框
七夜zippoe3 小时前
可解释AI:构建可信的机器学习系统——反事实解释与概念激活实战
人工智能·python·机器学习·可解释性·概念激活
Daydream.V3 小时前
OpenCV高端操作——光流估计(附案例)
人工智能·opencv·计算机视觉
YuanDaima20486 小时前
[CrewAI] 第15课|构建一个多代理系统来实现自动化简历定制和面试准备
人工智能·python·面试·agent·crewai
WHS-_-20226 小时前
Python 算法题学习笔记一
python·学习·算法
码界筑梦坊6 小时前
353-基于Python的大湾区气候数据可视化分析系统
开发语言·python·信息可视化·数据分析·django·vue·毕业设计
如何原谅奋力过但无声7 小时前
【chap11-动态规划(上 - 基础题目&背包问题)】用Python3刷《代码随想录》
数据结构·python·算法·动态规划