YOLO的txt数据筛选:如何挑选出包含固定类别的标签文件和图片

一共分两步:

第一步:在yolo所有的txt标签文件中挑出只包含固定类别的txt标签文件;

第二步:根据标签文件,筛选图片

第一步:

python 复制代码
import os.path
import shutil

# 遍历指定目录
def eachFile(filepath):
    # os.listdir: 该函数返回指定的文件夹包含的文件
    pathdir = os.listdir(filepath)
    for alldir in pathdir:
        child = os.path.join(filepath,alldir)
        if os.path.isfile(child):
            readfile(child)
            continue
        eachFile(child)

# 遍历出结果,返回文件的名字
def readfile(filename):
    f = open(filename, 'r')
    line = f.readline() # 以行的形式进行读取文件
    list1 = []
    while line:
        # line.split('\t''\n'):'\t'和'\n'是两个字符串,会自动进行拼接,形成'\t\n'作为分隔符。
        # 默认把所有的空格、制表符、回车符当作分隔符,并过滤掉空串。
        a = line.split()
        str = a[0]  # 读取改行的第一个数据(类别)
        if str == '0' or '1':
            list.append(filename)
            shutil.copy(filename, 'E:\multyfs2single\label0')  # 要保存的路径
            print("匹配到:" + filename)
        line = f.readline()
    f.close()

if __name__ == "__main__":
    filename = 'E:\multyfs2single\label'
    arr = []
    eachFile(filename)

第二步:

python 复制代码
import os
import shutil

txt_dir = "E:/multyfs2single/label0/"
image_dir = "E:/multyfs2single/img0/"
origin_img_dir = "E:/multyfs2single/img/"

for file in os.listdir(txt_dir):
    # splitext()是用于从后往前切割文件名,[0]:文件名;[1]:后缀
    shutil.copy(origin_img_dir + '/' + os.path.splitext(file)[0] + '.png',
                image_dir + '/' + os.path.splitext(file)[0] + '.png')
相关推荐
E_ICEBLUE31 分钟前
Python 控制 PDF 页面大小、页边距、页面方向与缩放
python·pdf
Polar__Star3 小时前
如何结合计划任务实现自动定时备份任务配置_全自动化运维管理
jvm·数据库·python
weixin_580614008 小时前
如何提取SQL日期中的年份_使用YEAR或EXTRACT函数
jvm·数据库·python
2301_813599558 小时前
SQL生产环境规范_数据库使用最佳实践
jvm·数据库·python
李可以量化8 小时前
QMT 量化实战:用 Python 实现线性回归通道,精准识别趋势中的支撑与压力(下)
python·qmt·量化 qmt ptrade
a9511416428 小时前
Go 中通过 channel 传递切片时的数据竞争与深拷贝解决方案
jvm·数据库·python
Dxy12393102168 小时前
Python 使用正则表达式将多个空格替换为一个空格
开发语言·python·正则表达式
qq_189807038 小时前
如何修改RAC数据库名_NID工具在集群环境下的改名步骤
jvm·数据库·python
zhangchaoxies8 小时前
如何检测SQL注入风险_利用模糊测试技术发现漏洞
jvm·数据库·python
Luca_kill9 小时前
MCP数据采集革命:从传统爬虫到智能代理的技术进化
爬虫·python·ai·数据采集·mcp·webscraping·集蜂云