车牌识别与定位数据集-CCPD2020

CCPD2020-voc 数据集结构说明

整体结构

复制代码
CCPD2020-voc/
├── train/          # 训练集(5769个样本)
│   ├── Annotations/      # XML标注文件(5769个)
│   ├── JPEGImages/       # 原始图像文件(5769张)
│   ├── plates/           # 裁剪出的车牌图像(5769张)
│   └── train.txt         # 训练集图像文件名列表
├── val/            # 验证集(1001个样本)
│   ├── Annotations/      # XML标注文件(1001个)
│   ├── JPEGImages/       # 原始图像文件(1001张)
│   ├── plates/           # 裁剪出的车牌图像(1001张)
│   └── val.txt           # 验证集图像文件名列表
└── test/           # 测试集(5006个样本)
    ├── Annotations/      # XML标注文件(5006个)
    ├── JPEGImages/       # 原始图像文件(5006张)
    ├── plates/           # 裁剪出的车牌图像(5006张)
    └── test.txt          # 测试集图像文件名列表

数据集展示

文件夹说明

1. Annotations/ 文件夹

  • 格式: PASCAL VOC格式的XML标注文件
  • 内容 : 每张图像对应一个XML文件,包含:
    • 图像基本信息(文件名、尺寸)
    • 车牌位置信息(边界框坐标)
    • 类别标签("plate"表示车牌)

XML文件示例结构:

复制代码
<annotation>
    <filename>图像文件名.jpg</filename>
    <size>
        <width>720</width>      # 图像宽度
        <height>1160</height>    # 图像高度
        <depth>3</depth>         # 通道数(RGB=3)
    </size>
    <object>
        <name>plate</name>       # 类别名称(车牌)
        <bndbox>
            <xmin>311</xmin>     # 边界框左上角x坐标
            <ymin>485</ymin>     # 边界框左上角y坐标
            <xmax>406</xmax>     # 边界框右下角x坐标
            <ymax>524</ymax>     # 边界框右下角y坐标
        </bndbox>
    </object>
</annotation>

2. JPEGImages/ 文件夹

  • 内容: 包含车牌的完整场景图像
  • 格式: JPG格式
  • 用途: 用于目标检测训练,需要检测出图像中的车牌位置

3. plates/ 文件夹

  • 内容: 从原始图像中裁剪出的车牌区域图像
  • 格式: JPG格式
  • 用途: 可能用于车牌字符识别任务(本训练代码主要用于定位,不使用此文件夹)

4. *.txt 文件(train.txt/val.txt/test.txt)

  • 内容: 每行一个图像文件名

  • 格式: 纯文本,每行一个文件名

  • 示例:

    00360785590278-91_265-311&485_406&524-406&524_313&520_311&485_402&489-0_0_3_24_28_24_31_33-117-16.jpg
    00373372395833-90_96-276&514_387&548-387&548_276&547_276&516_384&514-0_0_3_26_25_31_33_32-157-19.jpg

文件名编码说明

图像文件名包含丰富的信息(以CCPD数据集命名规则):

复制代码
00360785590278-91_265-311&485_406&524-406&524_313&520_311&485_402&489-0_0_3_24_28_24_31_33-117-16.jpg

各部分含义:

  • 00360785590278: 时间戳或唯一标识
  • 91_265: 车牌角度信息
  • 311&485_406&524: 车牌边界框坐标(xmin&ymin_xmax&ymax)
  • -406&524_313&520_311&485_402&489: 车牌四个角点坐标
  • 0_0_3_24_28_24_31_33: 车牌字符信息
  • 117-16: 其他属性

注意: 训练代码主要使用XML标注文件中的边界框信息,不需要解析文件名。

数据统计

数据集 图像数量 XML标注数量 说明
train 5769 5769 用于模型训练
val 1001 1001 用于验证和调参
test 5006 5006 用于最终测试评估
总计 11776 11776 完整数据集

标注格式转换

训练代码会将PASCAL VOC格式(XML)转换为YOLO格式(TXT):

VOC格式(XML):

  • 使用绝对像素坐标:xmin, ymin, xmax, ymax
  • 例如:xmin=311, ymin=485, xmax=406, ymax=524

YOLO格式(TXT):

  • 使用归一化相对坐标:class_id x_center y_center width height
  • 所有坐标值在0-1之间
  • 例如:0 0.497917 0.451724 0.131944 0.033621
    • 0: 类别ID(车牌=0)
    • 0.497917: 中心点x坐标/图像宽度
    • 0.451724: 中心点y坐标/图像高度
    • 0.131944: 边界框宽度/图像宽度
    • 0.033621: 边界框高度/图像高度

使用流程

  1. 数据准备: 数据集已经是VOC格式,包含train/val/test三个子集
  2. 格式转换: train.py会自动将VOC格式转换为YOLO格式
  3. 训练: 使用YOLOv8模型进行车牌检测训练
  4. 评估: 在test集上评估模型性能
相关推荐
33三 三like3 小时前
《基于知识图谱和智能推荐的养老志愿服务系统》开发日志
人工智能·知识图谱
芝士爱知识a3 小时前
【工具推荐】2026公考App横向评测:粉笔、华图与智蛙面试App功能对比
人工智能·软件推荐·ai教育·结构化面试·公考app·智蛙面试app·公考上岸
腾讯云开发者4 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗4 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
yLDeveloper4 小时前
从模型评估、梯度难题到科学初始化:一步步解析深度学习的训练问题
深度学习
Coder_Boy_5 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
啊森要自信5 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann
2401_836235865 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活
njsgcs5 小时前
llm使用 AgentScope-Tuner 通过 RL 训练 FrozenLake 智能体
人工智能·深度学习