车牌识别与定位数据集-CCPD2020

CCPD2020-voc 数据集结构说明

整体结构

复制代码
CCPD2020-voc/
├── train/          # 训练集(5769个样本)
│   ├── Annotations/      # XML标注文件(5769个)
│   ├── JPEGImages/       # 原始图像文件(5769张)
│   ├── plates/           # 裁剪出的车牌图像(5769张)
│   └── train.txt         # 训练集图像文件名列表
├── val/            # 验证集(1001个样本)
│   ├── Annotations/      # XML标注文件(1001个)
│   ├── JPEGImages/       # 原始图像文件(1001张)
│   ├── plates/           # 裁剪出的车牌图像(1001张)
│   └── val.txt           # 验证集图像文件名列表
└── test/           # 测试集(5006个样本)
    ├── Annotations/      # XML标注文件(5006个)
    ├── JPEGImages/       # 原始图像文件(5006张)
    ├── plates/           # 裁剪出的车牌图像(5006张)
    └── test.txt          # 测试集图像文件名列表

数据集展示

文件夹说明

1. Annotations/ 文件夹

  • 格式: PASCAL VOC格式的XML标注文件
  • 内容 : 每张图像对应一个XML文件,包含:
    • 图像基本信息(文件名、尺寸)
    • 车牌位置信息(边界框坐标)
    • 类别标签("plate"表示车牌)

XML文件示例结构:

复制代码
<annotation>
    <filename>图像文件名.jpg</filename>
    <size>
        <width>720</width>      # 图像宽度
        <height>1160</height>    # 图像高度
        <depth>3</depth>         # 通道数(RGB=3)
    </size>
    <object>
        <name>plate</name>       # 类别名称(车牌)
        <bndbox>
            <xmin>311</xmin>     # 边界框左上角x坐标
            <ymin>485</ymin>     # 边界框左上角y坐标
            <xmax>406</xmax>     # 边界框右下角x坐标
            <ymax>524</ymax>     # 边界框右下角y坐标
        </bndbox>
    </object>
</annotation>

2. JPEGImages/ 文件夹

  • 内容: 包含车牌的完整场景图像
  • 格式: JPG格式
  • 用途: 用于目标检测训练,需要检测出图像中的车牌位置

3. plates/ 文件夹

  • 内容: 从原始图像中裁剪出的车牌区域图像
  • 格式: JPG格式
  • 用途: 可能用于车牌字符识别任务(本训练代码主要用于定位,不使用此文件夹)

4. *.txt 文件(train.txt/val.txt/test.txt)

  • 内容: 每行一个图像文件名

  • 格式: 纯文本,每行一个文件名

  • 示例:

    00360785590278-91_265-311&485_406&524-406&524_313&520_311&485_402&489-0_0_3_24_28_24_31_33-117-16.jpg
    00373372395833-90_96-276&514_387&548-387&548_276&547_276&516_384&514-0_0_3_26_25_31_33_32-157-19.jpg

文件名编码说明

图像文件名包含丰富的信息(以CCPD数据集命名规则):

复制代码
00360785590278-91_265-311&485_406&524-406&524_313&520_311&485_402&489-0_0_3_24_28_24_31_33-117-16.jpg

各部分含义:

  • 00360785590278: 时间戳或唯一标识
  • 91_265: 车牌角度信息
  • 311&485_406&524: 车牌边界框坐标(xmin&ymin_xmax&ymax)
  • -406&524_313&520_311&485_402&489: 车牌四个角点坐标
  • 0_0_3_24_28_24_31_33: 车牌字符信息
  • 117-16: 其他属性

注意: 训练代码主要使用XML标注文件中的边界框信息,不需要解析文件名。

数据统计

数据集 图像数量 XML标注数量 说明
train 5769 5769 用于模型训练
val 1001 1001 用于验证和调参
test 5006 5006 用于最终测试评估
总计 11776 11776 完整数据集

标注格式转换

训练代码会将PASCAL VOC格式(XML)转换为YOLO格式(TXT):

VOC格式(XML):

  • 使用绝对像素坐标:xmin, ymin, xmax, ymax
  • 例如:xmin=311, ymin=485, xmax=406, ymax=524

YOLO格式(TXT):

  • 使用归一化相对坐标:class_id x_center y_center width height
  • 所有坐标值在0-1之间
  • 例如:0 0.497917 0.451724 0.131944 0.033621
    • 0: 类别ID(车牌=0)
    • 0.497917: 中心点x坐标/图像宽度
    • 0.451724: 中心点y坐标/图像高度
    • 0.131944: 边界框宽度/图像宽度
    • 0.033621: 边界框高度/图像高度

使用流程

  1. 数据准备: 数据集已经是VOC格式,包含train/val/test三个子集
  2. 格式转换: train.py会自动将VOC格式转换为YOLO格式
  3. 训练: 使用YOLOv8模型进行车牌检测训练
  4. 评估: 在test集上评估模型性能
相关推荐
极智视界4 小时前
分类数据集 - 自然灾害场景飓风野火洪水地震分类数据集下载
人工智能·yolo·数据集·图像分类·算法训练·自然灾害检测
GlobalInfo4 小时前
全球人工智能停车机器人市场份额、规模、技术研究报告2026
人工智能·机器人
XD7429716365 小时前
科技早报|2026年4月30日:AI 基础设施竞赛继续升温
人工智能·科技·科技新闻·科技早报
刘~浪地球5 小时前
DeepSeek V4 技术解读:MoE架构优化深度解析
人工智能·架构·deepseek v4
码点滴5 小时前
私有 Gateway 接入企业 IM:从消息路由到多租户隔离——Hermes Agent 工程实战
人工智能·架构·gateway·prompt·智能体·hermes
财迅通Ai5 小时前
德适发布医疗AI评测平台DoctorBench 智诊科技、谷歌、OpenAl位列三甲
人工智能·科技·德适-b
xiaozhazha_5 小时前
企业级AI视频会议私有化部署实践:应对安全合规与成本挑战的技术架构解析
人工智能·安全·架构
Mr数据杨5 小时前
飞船乘客状态预测与金融风控建模启发
大数据·机器学习·数据分析·kaggle
金融小师妹5 小时前
AI治理框架下的货币政策接续:鲍威尔理事留任机制与决策权迁移的系统博弈
大数据·人工智能·逻辑回归·能源
Elcker5 小时前
RAG教程-基础篇-第二节 RAG的技术原理
人工智能·ai编程·rag