xml2txt

-*- coding: utf-8 -*-

import xml.etree.ElementTree as ET

import os

from os import getcwd

sets = ['train', 'val', 'test']

classes = ["person"] # 改成自己的类别

abs_path = os.getcwd()

print(abs_path)

def convert(size, box):

dw = 1. / (size[0])

dh = 1. / (size[1])

x = (box[0] + box[1]) / 2.0 - 1

y = (box[2] + box[3]) / 2.0 - 1

w = box[1] - box[0]

h = box[3] - box[2]

x = x * dw

w = w * dw

y = y * dh

h = h * dh

return x, y, w, h

def convert_annotation(image_id):

in_file = open('data_prov2/xml/train/%s.xml' % (image_id), encoding='UTF-8')

out_file = open('data_prov2/labels/train/%s.txt' % (image_id), 'w')

tree = ET.parse(in_file)

root = tree.getroot()

size = root.find('size')

w = int(size.find('width').text)

h = int(size.find('height').text)

for obj in root.iter('object'):

difficult = obj.find('Difficult').text

difficult = obj.find('difficult').text

cls = obj.find('name').text

if cls not in classes or int(difficult) == 1:

continue

cls_id = classes.index(cls)

xmlbox = obj.find('bndbox')

b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),

float(xmlbox.find('ymax').text))

b1, b2, b3, b4 = b

标注越界修正

if b2 > w:

b2 = w

if b4 > h:

b4 = h

b = (b1, b2, b3, b4)

bb = convert((w, h), b)

out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

for image_set in sets:

if not os.path.exists('data_prov2/labels/train/'):

os.makedirs('data_prov2/labels/train/')

image_ids = open('data_prov2/dataSet/%s.txt' % (image_set)).read().strip().split()

list_file = open('data_prov2/%s.txt' % (image_set), 'w')

for image_id in image_ids:

list_file.write(abs_path + 'data_prov2/images/train/%s.jpg\n' % (image_id))

convert_annotation(image_id)

list_file.close()

相关推荐
啵啵鱼爱吃小猫咪5 分钟前
机器人路径规划算法大全RRT,APF,DS,RL
人工智能
AI小书房8 分钟前
【人工智能通识专栏】第十四讲:语音交互
人工智能
mit6.8241 小时前
[code-review] 日志机制 | `LOG_LEVEL`
人工智能·chatgpt·代码复审
I'm a winner1 小时前
第七章:AI进阶之------输入与输出函数(一)
开发语言·人工智能·python·深度学习·神经网络·microsoft·机器学习
Orange_sparkle1 小时前
解决Dify中接入xinference模型无法开关思考模式和使用function calling的问题
人工智能·深度学习·语言模型·chatgpt
xiaozhazha_1 小时前
低代码与AI技术在企业ERP系统构建中的实践应用——以快鹭云平台为例
人工智能·低代码
明天再做行么1 小时前
AI 时代,我们是否应该重温极限编程?
人工智能·低代码·极限编程
Codebee1 小时前
ood 框架深度解析:OneCode-RAD 跨平台移动开发套件的技术演进之路
人工智能·低代码
SmartBrain2 小时前
DeerFlow实践:华为ITR流程的评审智能体设计
人工智能·语言模型
程序员鱼皮2 小时前
我做了个 AI 文档阅读神器,免费开源!
人工智能·程序员·ai编程