基于YOLO的智能车辆检测与记录系统

摘要

本报告总结了智能车辆检测系统的开发工作，主要包括车辆数据标注、YOLO模型训练及QT交互系统搭建三部分。通过使用专业标注工具完成车辆目标数据集的标注与预处理，基于YOLO模型构建车辆检测算法并优化训练流程，最终开发出具备实时检测、结果统计及数据导出功能的QT应用系统。系统实现了对图像、视频及摄像头实时画面的车辆检测，支持检测置信度调节、检测结果可视化与统计分析，满足了车辆检测场景的实际应用需求。

基于YOLO的智能驾驶车辆识别与记录系统

一、数据标注工作

1. 数据采集与标注流程

数据采集 ：收集包含不同场景的汽车标注数据，包含
car
person
truck
bicycle
bus
traffic light
motorcycle
七类道路常见目标
标注工具 ：使用LabelImg工具进行手动标注，为每张图像中的车辆目标绘制边界框并标注类别，生成符合YOLO格式的标注文件（.txt），格式为[类别索引, 中心点x, 中心点y, 宽度, 高度]。
数据清洗：剔除标注错误、模糊不清的图像，确保数据集质量。

完整数据集获取请联系博客主

2. 数据预处理

数据集划分：按8:1:1比例将数据划分为训练集（4000张）、验证集（500张）和测试集（500张），保证数据分布均匀。
数据增强：通过旋转、翻转、亮度调整、高斯模糊等操作扩充数据集，提升模型泛化能力，最终训练集数据量扩充至8000+张。

二、YOLO模型训练工作

1. 模型选型与配置

模型选择：基于YOLOv8n轻量级模型作为基础架构，平衡检测精度与推理速度，适合实时检测场景。
参数配置 ：
- 输入图像尺寸：640×640像素
- 训练批次大小（Batch Size）：16
- 最大训练轮次（Epochs）：300
- 学习率策略：余弦退火衰减，初始学习率1e-3
- 数据增强策略：Mosaic、MixUp等YOLO原生增强方法

2. 训练与优化过程

损失函数：使用YOLO原生的Bounding Box Loss（CIoU）、分类损失（CrossEntropy）和置信度损失（BCEWithLogitsLoss）组合优化检测效果。
训练监控 ：通过TensorBoard监控训练过程，重点关注：
- 损失函数收敛情况（训练损失与验证损失）
- 检测指标（mAP@0.5、精确率、召回率）
模型优化 ：
- 针对小目标车辆检测效果不佳的问题，调整锚框参数以匹配车辆目标尺寸。
- 冻结骨干网络进行迁移学习，提高训练效率。

3. 模型评估

评估指标 ：在测试集上达到以下性能：
- mAP@0.5：92.3%
- 推理速度：在CPU（Intel i7-11700）上达到25 FPS，满足实时性要求。

三、QT系统搭建工作

1. 系统架构设计

模块划分 ：
- 视频输入模块：支持图像、本地视频、摄像头三种输入源
- 检测处理模块：集成YOLO模型推理，实时处理视频帧
- 结果展示模块：可视化检测结果（边界框、类别标签），统计检测数据
- 数据管理模块：支持检测结果保存（CSV、JSON、PDF报告）

2. 核心功能实现

实时检测功能 ：
- 使用QThread实现多线程处理，避免UI卡顿，主线程负责界面渲染，子线程处理模型推理。
- 支持动态调整检测置信度阈值，通过滑块控件实时生效。
UI交互设计 ：
- 采用现代化UI风格，使用卡片式布局、动画按钮提升交互体验。
- 检测统计面板包含总检测数、类别统计及实时帧率显示，通过QScrollArea解决多类别统计重叠问题。
结果导出功能 ：
- 支持将检测结果保存为结构化数据（CSV、JSON），生成包含检测可视化图像和统计数据的PDF报告。

3. 技术难点与解决方案

问题1 ：检测统计面板在多类别场景下出现内容重叠。
- 方案：为类别统计区域添加QScrollArea滚动组件，动态适应内容长度，优化布局管理逻辑，避免UI组件生命周期异常。
问题2 ：视频流处理时UI响应卡顿。
- 方案：采用线程安全的信号-槽机制传递检测结果，分离计算与渲染逻辑，确保界面流畅。

四、成果总结

数据层面：完成高质量车辆检测数据集构建，标注数据千+张。
模型层面：基于YOLOv8n训练的车辆检测模型达到mAP@0.5=92.3%，满足实时检测需求。
系统层面：开发出功能完整的QT检测系统，支持多源输入、实时检测、统计分析及结果导出，解决了UI布局重叠、线程安全等技术问题。

本系统可应用于交通监控、智能停车、车辆流量统计等场景，后续可进一步优化模型精度，扩展多目标检测功能（如行人、交通标志等），提升系统实用性。