python文件操作之xml转txt

在使用yolo进行深度学习训练时,我们所使用的标签文件都是txt格式的,但是有的人使用的标注软件生成的可能是xml文件,那么就需要使用python工具写一个格式转换脚本。

首先导入库,并定义标注的图片地址、生成的标签文件xml地址、存储结果txt的地址。

复制代码
import cv2
import os
import math
import xml.dom.minidom

path_img = r'/home/pc/下载/qq_file/test/img/'
path_xml = r'/home/pc/下载/qq_file/test/xml/'
path_txt = r'/home/pc/下载/qq_file/test/txt/'

files = os.listdir(path_xml)这句话的files存储了path_xml路径下的所有xml文件

复制代码
if __name__ == "__main__":
    files = os.listdir(path_xml)
    print("文件数量: " + str(len(files)))
    for file in files:
        print(file)

如上代码的file打印结果就应该为目标文件夹下所有xml文件的文件名,如246.xml。

复制代码
if __name__ == "__main__":
    files = os.listdir(path_xml)
    print("文件数量: " + str(len(files)))
    for file in files:
        print(file)
        xmlname = file.split('.')
        txtname = xmlname[0] + '.txt'
        imgname = xmlname[0] + '.jpg'

        txtpath = path_txt + txtname
        imgpath = path_img + imgname
        xmlpath = path_xml + xmlname[0] + '.' + xmlname[1]

接下来用" . "来分割xml文件的文件名和后缀,其中xmlname0 = 文件名,xmlname1 = xml。由此可以定义每一个xml、txt、jpg的路径。

复制代码
if __name__ == "__main__":
    files = os.listdir(path_xml)
    print("文件数量: " + str(len(files)))
    for file in files:
        print(file)
        xmlname = file.split('.')
        txtname = xmlname[0] + '.txt'
        imgname = xmlname[0] + '.jpg'

        txtpath = path_txt + txtname
        imgpath = path_img + imgname
        xmlpath = path_xml + xmlname[0] + '.' + xmlname[1]
        # print(xmlpath)

        file_txt = open(txtpath, 'w+')
        frame = cv2.imread(imgpath)
        pixel_size = frame.shape[0]
        print(pixel_size)

接下来定义file_txt为文件夹下每一个txt文件,并可进行write操作。

复制代码
# 将解析xml文件的结果存在dom变量下
        dom = xml.dom.minidom.parse(xmlpath)
        # 获取xml文件的根元素
        root = dom.documentElement
        objects = root.getElementsByTagName('object')

        for obj in objects:
            name = obj.getElementsByTagName('name')[0]  # [0]可能代表包含标签数值的一个集合(这里可能包含标签数值,地址等)
            if name.childNodes[0].data == 'armor_red':  # 通过调用name.childNodes[0].data方法获取标签数值
                file_txt.write('0 ')
            elif name.childNodes[0].data == 'full_red':
                file_txt.write('1 ')
            elif name.childNodes[0].data == 'R_red':
                file_txt.write('2 ')
            else:
                print(file + ":label error")

            robodbox = obj.getElementsByTagName('robodbox')
            cx = obj.getElementsByTagName('cx')[0]
            cy = obj.getElementsByTagName('cy')[0]
            w = obj.getElementsByTagName('w')[0]
            h = obj.getElementsByTagName('h')[0]
            angle = obj.getElementsByTagName('angle')[0]
            # print(f"cx = {cx.childNodes[0]}, cy = {cy.childNodes[0].data}, w = {w.childNodes[0].data}, h = {h.childNodes[0].data}, "
            #       f"angle = {angle.childNodes[0].data}")

            temp_cx = str(float(cx.childNodes[0].data) / pixel_size)
            temp_cy = str(float(cy.childNodes[0].data) / pixel_size)
            temp_h = str(float(h.childNodes[0].data) / pixel_size)
            temp_w = str(float(w.childNodes[0].data) / pixel_size)
            temp_angle = str(float(angle.childNodes[0].data) / math.pi*180)

接下来对xml文件进行解析,调用dom = xml.dom.minidom.parse(xmlpath),将解析xml文件的结果存在dom变量下;root = dom.documentElement,获取xml文件的根元素root;objects = root.getElementsByTagName('object'),获得object;使用for循环遍历每一个object,使用name = obj.getElementsByTagName('name')0来获得每一个object的name,这里0可能代表包含标签数值的一个集合(这里可能包含标签数值,地址等),然后判断

if name.childNodes0.data == 'armor_red'

file_txt.write('0 ')

通过调用name.childNodes0.data方法获取标签数值,写入txt文件作为第一个数值,即"类别"。

复制代码
            robodbox = obj.getElementsByTagName('robodbox')
            cx = obj.getElementsByTagName('cx')[0]
            cy = obj.getElementsByTagName('cy')[0]
            w = obj.getElementsByTagName('w')[0]
            h = obj.getElementsByTagName('h')[0]
            angle = obj.getElementsByTagName('angle')[0]
            # print(f"cx = {cx.childNodes[0]}, cy = {cy.childNodes[0].data}, w = {w.childNodes[0].data}, h = {h.childNodes[0].data}, "
            #       f"angle = {angle.childNodes[0].data}")

            temp_cx = str(float(cx.childNodes[0].data) / pixel_size)
            temp_cy = str(float(cy.childNodes[0].data) / pixel_size)
            temp_h = str(float(h.childNodes[0].data) / pixel_size)
            temp_w = str(float(w.childNodes[0].data) / pixel_size)
            temp_angle = str(float(angle.childNodes[0].data) / math.pi*180)

            file_txt.write(temp_cx + ' ')
            file_txt.write(temp_cy + ' ')
            file_txt.write(temp_w + ' ')
            file_txt.write(temp_h + ' ')
            file_txt.write(temp_angle + ' ')
            file_txt.write('\n')

类别信息获取后,接下来对矩形框数值进行解析,使用同样的方法获取数据,并进行归一化写入txt。

完整代码如下

复制代码
import cv2
import os
import math
import xml.dom.minidom

path_img = r'/home/pc/下载/qq_file/test/img/'
path_xml = r'/home/pc/下载/qq_file/test/xml/'
path_txt = r'/home/pc/下载/qq_file/test/txt/'

if __name__ == "__main__":
    files = os.listdir(path_xml)
    print("文件数量: " + str(len(files)))
    for file in files:
        print(file)
        xmlname = file.split('.')
        txtname = xmlname[0] + '.txt'
        imgname = xmlname[0] + '.jpg'

        txtpath = path_txt + txtname
        imgpath = path_img + imgname
        xmlpath = path_xml + xmlname[0] + '.' + xmlname[1]
        # print(xmlpath)

        file_txt = open(txtpath, 'w+')
        frame = cv2.imread(imgpath)
        pixel_size = frame.shape[0]
        # print(pixel_size)

        # 将解析xml文件的结果存在dom变量下
        dom = xml.dom.minidom.parse(xmlpath)
        # 获取xml文件的根元素
        root = dom.documentElement
        objects = root.getElementsByTagName('object')

        for obj in objects:
            name = obj.getElementsByTagName('name')[0]  # [0]可能代表包含标签数值的一个集合(这里可能包含标签数值,地址等)
            if name.childNodes[0].data == 'armor_red':  # 通过调用name.childNodes[0].data方法获取标签数值
                file_txt.write('0 ')
            elif name.childNodes[0].data == 'full_red':
                file_txt.write('1 ')
            elif name.childNodes[0].data == 'R_red':
                file_txt.write('2 ')
            else:
                print(file + ":label error")

            robodbox = obj.getElementsByTagName('robodbox')
            cx = obj.getElementsByTagName('cx')[0]
            cy = obj.getElementsByTagName('cy')[0]
            w = obj.getElementsByTagName('w')[0]
            h = obj.getElementsByTagName('h')[0]
            angle = obj.getElementsByTagName('angle')[0]
            # print(f"cx = {cx.childNodes[0]}, cy = {cy.childNodes[0].data}, w = {w.childNodes[0].data}, h = {h.childNodes[0].data}, "
            #       f"angle = {angle.childNodes[0].data}")

            temp_cx = str(float(cx.childNodes[0].data) / pixel_size)
            temp_cy = str(float(cy.childNodes[0].data) / pixel_size)
            temp_h = str(float(h.childNodes[0].data) / pixel_size)
            temp_w = str(float(w.childNodes[0].data) / pixel_size)
            temp_angle = str(float(angle.childNodes[0].data) / math.pi*180)

            file_txt.write(temp_cx + ' ')
            file_txt.write(temp_cy + ' ')
            file_txt.write(temp_w + ' ')
            file_txt.write(temp_h + ' ')
            file_txt.write(temp_angle + ' ')
            file_txt.write('\n')

        print("ok")
        file_txt.close()
相关推荐
(Charon)3 分钟前
【C++ 面试高频基础:指针、引用、const、static、new/delete 总结】
java·开发语言
Yeats_Liao21 分钟前
Feed流系统设计(三):数据模型与存储设计,从表结构到Redis收件箱
java·javascript·redis
JiaHao汤26 分钟前
分布式事务方案全景:从理论到 Seata 落地
java·分布式·spring·spring cloud
色空大师1 小时前
【debug调试详解-idea】
java·ide·intellij-idea·调试·远程调试
程序猿阿越1 小时前
AutoMQ源码(一)读、写、Compaction
java·后端·源码
茉莉玫瑰花茶2 小时前
综合案例 - AI 智能租房助手 [ 5 ]
服务器·数据库·人工智能·python·ai
ywl4708120872 小时前
jwt生产token,简单版helloworld
java·数据库·spring
未若君雅裁2 小时前
生产问题排查与性能瓶颈定位:日志、监控、链路追踪、压测与Arthas
java·web安全
文艺倾年2 小时前
【强化学习】强化学习基本概念,20W字总结(一)
人工智能·python·语言模型·自然语言处理·面试·职场和发展·大模型
宸丶一2 小时前
Day 13:持久化记忆 - 让 Agent 拥有长期记忆
jvm·python·ai