计算机视觉——手机目标检测数据集

这是一个手机目标检测的数据集,数据集的标注工具是labelimg,数据格式是voc格式,要训练yolo模型的话,可以使用脚本改成txt格式,数据集标注了手机,标签名:telephone,数据集总共有1960张,有一部分是直实数据,有一部分是是真实数据。

数据集地址:https://download.csdn.net/download/matt45m/89136478

数据标注如下:

数据保存目录如下:

xml标签文件:

xml 复制代码
<annotation>
<folder>JPEGImages</folder>
<filename>bs001783.jpg</filename>
<path>JPEGImages\bs001783.jpg</path>
<source>
<database>Unknown</database>
</source>
<size>
<width>1920</width>
<height>1080</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>telephone</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>1058</xmin>
<ymin>936</ymin>
<xmax>1123</xmax>
<ymax>977</ymax>
</bndbox>
</object>
</annotation>

python代码实现可视化:

python 复制代码
import xml.etree.ElementTree as ET
import os
import cv2

# ******************************************
src_XML_dir = r'labels'  # xml源路径
src_IMG_dir = r'images'  # IMG原路径
IMG_format = '.jpg'    # IMG格式
out_dir = 'out'  # 输出路径
# ******************************************

if not os.path.exists(out_dir):
    os.makedirs(out_dir)
xml_file = os.listdir(src_XML_dir)  # 只返回文件名称,带后缀

for each_XML in xml_file:  # 遍历所有xml文件
    # 读入IMG
    xml_FirstName = os.path.splitext(each_XML)[0]
    img_save_file = os.path.join(out_dir, xml_FirstName+IMG_format)
    img_src_path = os.path.join(src_IMG_dir, xml_FirstName+IMG_format)
    img = cv2.imread(img_src_path)
    # 解析XML
    each_XML_fullPath = src_XML_dir + '/' + each_XML  # 每个xml文件的完整路径
    tree = ET.parse(each_XML_fullPath)  # ET.parse()内要为完整相对路径
    root = tree.getroot()  # 类型为element

    # 画框
    for obj in root.findall('object'):
        if obj.find('bndbox'):
            bndbox = obj.find('bndbox')
            xmin = int(bndbox.find('xmin').text)
            xmax = int(bndbox.find('xmax').text)
            ymin = int(bndbox.find('ymin').text)
            ymax = int(bndbox.find('ymax').text)

            cv2.rectangle(img=img,
                          pt1=(xmin,ymin),
                          pt2=(xmax,ymax),
                          color=(255,0,0),
                          thickness=2)

    cv2.imwrite(filename=img_save_file, img=img)
    print('保存结果{}'.format(xml_FirstName))
相关推荐
兮℡檬,3 小时前
答题卡识别判卷
开发语言·python·计算机视觉
Techblog of HaoWANG3 小时前
目标检测与跟踪(12)-- Jetson Xavier NX / Orin NX ROS及视觉检测环境配置、移植、部署指南
人工智能·目标检测·计算机视觉·机器人·视觉检测·控制
zl_vslam7 小时前
SLAM中的非线性优-3D图优化之IMU预积分SE3推导(二十一)
人工智能·算法·计算机视觉·3d
当交通遇上机器学习8 小时前
IEEEICDE2025 | TimeKD:融合大语言模型与知识蒸馏的时间序列预测方法
人工智能·深度学习·机器学习·计算机视觉·语言模型
sali-tec8 小时前
C# 基于OpenCv的视觉工作流-章43-轮廓匹配
图像处理·人工智能·opencv·算法·计算机视觉
Fleshy数模9 小时前
玩转OpenCV:从角点检测到图像拼接的实战之旅
人工智能·opencv·计算机视觉
鹭天10 小时前
目标检测学习笔记
笔记·学习·目标检测
badhope11 小时前
2026年零基础打造专属AI机器人:从GitHub开源项目到个人智能助手,完整实战指南
人工智能·python·深度学习·计算机视觉·数据挖掘·github·语音识别
不懒不懒11 小时前
【OpenCV 计算机视觉实战:从图像分割到特征匹配,全流程实战教程】
人工智能·opencv·计算机视觉
拉拉拉拉拉拉拉马12 小时前
目标检测与目标跟踪的区别:结合具体模型结构深入理解
人工智能·目标检测·目标跟踪