YOLO的txt数据筛选:如何挑选出包含固定类别的标签文件和图片

一共分两步:

第一步:在yolo所有的txt标签文件中挑出只包含固定类别的txt标签文件;

第二步:根据标签文件,筛选图片

第一步:

python 复制代码
import os.path
import shutil

# 遍历指定目录
def eachFile(filepath):
    # os.listdir: 该函数返回指定的文件夹包含的文件
    pathdir = os.listdir(filepath)
    for alldir in pathdir:
        child = os.path.join(filepath,alldir)
        if os.path.isfile(child):
            readfile(child)
            continue
        eachFile(child)

# 遍历出结果,返回文件的名字
def readfile(filename):
    f = open(filename, 'r')
    line = f.readline() # 以行的形式进行读取文件
    list1 = []
    while line:
        # line.split('\t''\n'):'\t'和'\n'是两个字符串,会自动进行拼接,形成'\t\n'作为分隔符。
        # 默认把所有的空格、制表符、回车符当作分隔符,并过滤掉空串。
        a = line.split()
        str = a[0]  # 读取改行的第一个数据(类别)
        if str == '0' or '1':
            list.append(filename)
            shutil.copy(filename, 'E:\multyfs2single\label0')  # 要保存的路径
            print("匹配到:" + filename)
        line = f.readline()
    f.close()

if __name__ == "__main__":
    filename = 'E:\multyfs2single\label'
    arr = []
    eachFile(filename)

第二步:

python 复制代码
import os
import shutil

txt_dir = "E:/multyfs2single/label0/"
image_dir = "E:/multyfs2single/img0/"
origin_img_dir = "E:/multyfs2single/img/"

for file in os.listdir(txt_dir):
    # splitext()是用于从后往前切割文件名,[0]:文件名;[1]:后缀
    shutil.copy(origin_img_dir + '/' + os.path.splitext(file)[0] + '.png',
                image_dir + '/' + os.path.splitext(file)[0] + '.png')
相关推荐
知乎的哥廷根数学学派7 小时前
面向可信机械故障诊断的自适应置信度惩罚深度校准算法(Pytorch)
人工智能·pytorch·python·深度学习·算法·机器学习·矩阵
且去填词8 小时前
DeepSeek :基于 Schema 推理与自愈机制的智能 ETL
数据仓库·人工智能·python·语言模型·etl·schema·deepseek
人工干智能8 小时前
OpenAI Assistants API 中 client.beta.threads.messages.create方法,兼谈一星*和两星**解包
python·llm
databook8 小时前
当条形图遇上极坐标:径向与圆形条形图的视觉革命
python·数据分析·数据可视化
阿部多瑞 ABU8 小时前
`chenmo` —— 可编程元叙事引擎 V2.3+
linux·人工智能·python·ai写作
acanab8 小时前
VScode python插件
ide·vscode·python
知乎的哥廷根数学学派9 小时前
基于生成对抗U-Net混合架构的隧道衬砌缺陷地质雷达数据智能反演与成像方法(以模拟信号为例,Pytorch)
开发语言·人工智能·pytorch·python·深度学习·机器学习
WangYaolove131410 小时前
Python基于大数据的电影市场预测分析(源码+文档)
python·django·毕业设计·源码
知乎的哥廷根数学学派10 小时前
基于自适应多尺度小波核编码与注意力增强的脉冲神经网络机械故障诊断(Pytorch)
人工智能·pytorch·python·深度学习·神经网络·机器学习
童话名剑10 小时前
锚框 与 完整YOLO示例(吴恩达深度学习笔记)
笔记·深度学习·yolo··anchor box