【配置 YOLOX 用于按目录分类的图片数据集】

现在的图标点选越来越多,如何一步解决,采用 YOLOX 目标检测模式则可以轻松解决

要在 YOLOX 中使用按目录分类的图片数据集(每个目录代表一个类别,目录下是该类别的所有图片),你需要进行以下配置步骤:

将需要检测的图标截取为独立的图片,放入到对应的目录中,如 banner ,apple 等

1. 准备数据集结构

假设你的原始数据集结构如下:

bash 复制代码
dataset_root/
    class1/
        img1.jpg
        img2.jpg
        ...
    class2/
        img1.jpg
        img2.jpg
        ...
    ...

2. 转换为 YOLOX 所需的格式

YOLOX 通常需要以下格式:

复制代码
图片文件

对应的标注文件(每个图片一个 .txt 文件)

训练/验证集的划分文件

创建 Python 转换脚本

python 复制代码
import os
import glob
from sklearn.model_selection import train_test_split

def convert_directory_to_yolox(dataset_root, output_dir):
    # 获取所有类别
    classes = [d for d in os.listdir(dataset_root) 
              if os.path.isdir(os.path.join(dataset_root, d))]
    classes.sort()
    
    # 创建类别映射文件
    with open(os.path.join(output_dir, 'classes.txt'), 'w') as f:
        f.write('\n'.join(classes))
    
    # 收集所有图片路径和标签
    image_paths = []
    labels = []
    for class_id, class_name in enumerate(classes):
        class_dir = os.path.join(dataset_root, class_name)
        for img_path in glob.glob(os.path.join(class_dir, '*')):
            if img_path.lower().endswith(('.png', '.jpg', '.jpeg')):
                image_paths.append(img_path)
                labels.append(class_id)
    
    # 划分训练集和验证集
    train_img, val_img, train_lbl, val_lbl = train_test_split(
        image_paths, labels, test_size=0.2, random_state=42)
    
    # 创建标注文件和数据集列表
    def write_dataset(img_list, lbl_list, list_file):
        with open(list_file, 'w') as f_list:
            for img_path, label in zip(img_list, lbl_list):
                # 创建标注文件路径
                base_name = os.path.splitext(os.path.basename(img_path))[0]
                txt_path = os.path.join(output_dir, 'labels', base_name + '.txt')
                
                # 写入标注文件
                os.makedirs(os.path.dirname(txt_path), exist_ok=True)
                with open(txt_path, 'w') as f_txt:
                    # YOLO格式: class_id x_center y_center width height
                    # 对于全图分类,bbox是整张图片
                    f_txt.write(f"{label} 0.5 0.5 1.0 1.0\n")
                
                # 写入数据集列表
                f_list.write(f"{img_path}\n")
    
    os.makedirs(os.path.join(output_dir, 'labels'), exist_ok=True)
    write_dataset(train_img, train_lbl, os.path.join(output_dir, 'train.txt'))
    write_dataset(val_img, val_lbl, os.path.join(output_dir, 'val.txt'))

# 使用示例
convert_directory_to_yolox('path/to/your/dataset_root', 'path/to/yolox_dataset')

3. 配置 YOLOX

修改 exps 中的配置文件

找到或创建你的实验配置文件(如 exps/example/yolox_s.py),修改以下部分:

bash 复制代码
class Exp(yolox_base.Exp):
    def __init__(self):
        super(Exp, self).__init__()
        self.num_classes = 你的类别数量
        self.data_dir = "转换后的数据集路径"
        self.train_ann = "train.txt"
        self.val_ann = "val.txt"
        self.input_size = (640, 640)  # 根据你的需求调整
        self.test_size = (640, 640)

修改数据加载部分

确保你的数据加载器能够处理这种格式。YOLOX 默认使用 MosaicDetection 数据集,你可能需要自定义:

python 复制代码
from yolox.data import get_yolox_datadir
from yolox.data.datasets import DATASET_REGISTRY

@DATASET_REGISTRY.register()
class YourDataset(Dataset):
    def __init__(self, ...):
        # 实现你的数据集加载逻辑
        pass

4. 训练命令

使用修改后的配置运行训练:

python 复制代码
python tools/train.py -f exps/example/yolox_s.py -d 1 -b 64 --fp16 -o -c yolox_s.pth

注意事项

复制代码
这种方法将整个图像作为一个"边界框"处理,适用于图像分类任务

如果你需要真正的目标检测(图像中有多个对象),需要为每个对象提供精确的边界框标注

考虑调整输入尺寸以适应你的图像比例

对于分类任务,可能需要修改损失函数为更适合分类的损失(如交叉熵)

如果你需要真正的目标检测而不是图像分类,则需要为每个图像提供包含对象位置和类别的详细标注文件。

相关推荐
AI Echoes几秒前
从零构建企业级LLMOps平台:LMForge——支持多模型、可视化编排、知识库与安全审核的全栈解决方案
人工智能·python·langchain·开源·agent
Coovally AI模型快速验证几秒前
无人机小目标检测新SOTA:MASF-YOLO重磅开源,多模块协同助力精度飞跃
人工智能·yolo·目标检测·机器学习·计算机视觉·无人机
zskj_zhyl6 分钟前
七彩喜智慧养老:科技向善,让“养老”变“享老”的智慧之选
大数据·人工智能·科技·物联网·机器人
微盛企微增长小知识13 分钟前
企业微信AI怎么用才高效?3大功能+5个实操场景,实测效率提升50%
人工智能·企业微信
啦啦啦在冲冲冲20 分钟前
解释一下roberta,bert-chinese和bert-case有啥区别还有bert-large这些
人工智能·深度学习·bert
deepdata_cn21 分钟前
混合架构大型语言模型(Jamba)
人工智能·语言模型
居7然22 分钟前
从零开始学大模型之预训练语言模型
人工智能·语言模型·自然语言处理·大模型
2401_8979300644 分钟前
PyTorch 中训练语言模型过程
人工智能·pytorch·语言模型
Edward.W44 分钟前
别再和正则表达式死磕了!这套AI工具集让你的开发效率翻倍⚙️[特殊字符]
人工智能·正则表达式