CCPD2020-voc 数据集结构说明
整体结构
CCPD2020-voc/
├── train/ # 训练集(5769个样本)
│ ├── Annotations/ # XML标注文件(5769个)
│ ├── JPEGImages/ # 原始图像文件(5769张)
│ ├── plates/ # 裁剪出的车牌图像(5769张)
│ └── train.txt # 训练集图像文件名列表
├── val/ # 验证集(1001个样本)
│ ├── Annotations/ # XML标注文件(1001个)
│ ├── JPEGImages/ # 原始图像文件(1001张)
│ ├── plates/ # 裁剪出的车牌图像(1001张)
│ └── val.txt # 验证集图像文件名列表
└── test/ # 测试集(5006个样本)
├── Annotations/ # XML标注文件(5006个)
├── JPEGImages/ # 原始图像文件(5006张)
├── plates/ # 裁剪出的车牌图像(5006张)
└── test.txt # 测试集图像文件名列表
数据集展示





文件夹说明
1. Annotations/ 文件夹
- 格式: PASCAL VOC格式的XML标注文件
- 内容 : 每张图像对应一个XML文件,包含:
- 图像基本信息(文件名、尺寸)
- 车牌位置信息(边界框坐标)
- 类别标签("plate"表示车牌)
XML文件示例结构:
<annotation>
<filename>图像文件名.jpg</filename>
<size>
<width>720</width> # 图像宽度
<height>1160</height> # 图像高度
<depth>3</depth> # 通道数(RGB=3)
</size>
<object>
<name>plate</name> # 类别名称(车牌)
<bndbox>
<xmin>311</xmin> # 边界框左上角x坐标
<ymin>485</ymin> # 边界框左上角y坐标
<xmax>406</xmax> # 边界框右下角x坐标
<ymax>524</ymax> # 边界框右下角y坐标
</bndbox>
</object>
</annotation>
2. JPEGImages/ 文件夹
- 内容: 包含车牌的完整场景图像
- 格式: JPG格式
- 用途: 用于目标检测训练,需要检测出图像中的车牌位置
3. plates/ 文件夹
- 内容: 从原始图像中裁剪出的车牌区域图像
- 格式: JPG格式
- 用途: 可能用于车牌字符识别任务(本训练代码主要用于定位,不使用此文件夹)
4. *.txt 文件(train.txt/val.txt/test.txt)
-
内容: 每行一个图像文件名
-
格式: 纯文本,每行一个文件名
-
示例:
00360785590278-91_265-311&485_406&524-406&524_313&520_311&485_402&489-0_0_3_24_28_24_31_33-117-16.jpg
00373372395833-90_96-276&514_387&548-387&548_276&547_276&516_384&514-0_0_3_26_25_31_33_32-157-19.jpg
文件名编码说明
图像文件名包含丰富的信息(以CCPD数据集命名规则):
00360785590278-91_265-311&485_406&524-406&524_313&520_311&485_402&489-0_0_3_24_28_24_31_33-117-16.jpg
各部分含义:
00360785590278: 时间戳或唯一标识91_265: 车牌角度信息311&485_406&524: 车牌边界框坐标(xmin&ymin_xmax&ymax)-406&524_313&520_311&485_402&489: 车牌四个角点坐标0_0_3_24_28_24_31_33: 车牌字符信息117-16: 其他属性
注意: 训练代码主要使用XML标注文件中的边界框信息,不需要解析文件名。
数据统计
| 数据集 | 图像数量 | XML标注数量 | 说明 |
|---|---|---|---|
| train | 5769 | 5769 | 用于模型训练 |
| val | 1001 | 1001 | 用于验证和调参 |
| test | 5006 | 5006 | 用于最终测试评估 |
| 总计 | 11776 | 11776 | 完整数据集 |
标注格式转换
训练代码会将PASCAL VOC格式(XML)转换为YOLO格式(TXT):
VOC格式(XML):
- 使用绝对像素坐标:xmin, ymin, xmax, ymax
- 例如:xmin=311, ymin=485, xmax=406, ymax=524
YOLO格式(TXT):
- 使用归一化相对坐标:class_id x_center y_center width height
- 所有坐标值在0-1之间
- 例如:0 0.497917 0.451724 0.131944 0.033621
- 0: 类别ID(车牌=0)
- 0.497917: 中心点x坐标/图像宽度
- 0.451724: 中心点y坐标/图像高度
- 0.131944: 边界框宽度/图像宽度
- 0.033621: 边界框高度/图像高度
使用流程
- 数据准备: 数据集已经是VOC格式,包含train/val/test三个子集
- 格式转换: train.py会自动将VOC格式转换为YOLO格式
- 训练: 使用YOLOv8模型进行车牌检测训练
- 评估: 在test集上评估模型性能