摘要:本研究使用的数据集由猿创作者团队整理优化,专门针对轨道交通车站客流监控应用场景设计,主要包含车站内行人的常规数据。所有样本均来自真实的轨道交通车站环境,能够有效反映行人在不同场景下的行为模式和复杂性。数据集采用YOLO目标检测标准格式,重点聚焦于行人检测,为轨道交通领域的智能监控与客流分析提供了宝贵的数据资源。
作者:bob
数据集概览
本数据集为猿创作者团队整理优化,仅限科研与教学使用。
1.数据类型
本研究采用轨道交通车站客流YOLO格式检测数据集,通过边界框对行人进行定位与分类,适用于基于YOLO的实时客流检测任务。
2.标注格式
本研究采用YOLO系列目标检测算法通用的标注格式对数据集进行标注。如图所示,YOLO标注文件以文本形式存储,每行对应一个目标实例,主要包含目标类别编号、边界框中心点的相对坐标以及边界框的相对宽度和高度。所有坐标信息均采用相对于原始图像尺寸的归一化表示,取值范围为0至1,从而减少不同分辨率图像对模型训练的影响,并提高模型在多尺度目标检测任务中的适应性。

图1 YOLO 图像目标检测标注格式示意图
3.数据增强
在轨道交通车站客流密度实时监测与拥挤预警系统的训练过程中,为了提升模型的泛化能力和鲁棒性,我们采用了数据增强技术。数据增强通过对训练数据进行一系列的变换,扩展了训练集的多样性,使模型能够学习到更多场景和环境下的特征,进而避免模型在面对未知数据时发生过拟合。

图2 数据集图像增强方法示例
亮度调整被应用于训练样本,随机调整图像亮度范围在-25%到+25%之间,以模拟不同光照条件下的场景变化,帮助模型应对光照变化带来的挑战。边界框裁剪设置最小裁剪为0%、最大裁剪为20%,通过去除图像部分区域模拟拥挤场景,提升模型在拥挤或遮挡环境中的检测性能,确保在乘客密集或区域遮挡时仍能准确识别行为。
3.数据集划分
为保证模型训练与性能评估的客观性与可靠性,本文将所构建的数据集划分为训练集、验证集和测试集三部分。数据集按照 70% / 20% / 10% 的比例进行划分,其中训练集包含 3683 张图像,用于模型参数的学习;验证集包含 1052 张图像,用于模型超参数的调整与中间性能评估;测试集包含 527 张图像,用于对模型最终检测性能进行客观评估。该数据划分策略有助于系统性地分析模型的泛化性能。

图3 数据集在训练、验证和测试集上的分布
数据集来源
本系统采用猿创(2zocde)团队整理和优化的轨道交通车站客流数据集,该数据集围绕车站内客流场景构建。数据集包含数千张高质量影像样本,涵盖多样化车站场景,能够真实地反映实际应用环境中客流密度的变化特征,确保数据的多样性与代表性。这些数据被用于目标检测模型的训练、验证与测试,提升了模型在车站内拥挤等场景的识别准确率及系统整体检测性能。通过实时监测车站内客流密度,系统能够及时预警,确保乘客的安全与顺畅通行。

图4 数据集图片
数据集类别

表1 数据类别
数据集用途
本数据集用于轨道交通车站客流检测模型的训练与验证,包含行人目标的检测样本。可应用于以下研究与开发方向:
(1)模型训练:支持基于 YOLOv 等目标检测模型进行轨道交通车站客流检测。
(2)性能评估:用于评估模型在客流检测任务中的检测精度与鲁棒性。
(3)系统开发:为轨道交通智能监控与客流管理系统提供数据支持。
数据集性能
(1)模型训练过程分析

图5 YOLOv11模型训练与验证损失函数变化曲线
这张图展示了训练过程中不同损失函数(如box_loss、cls_loss、dfl_loss)以及性能指标(如precision、recall、mAP50等)的变化,蓝色曲线表示训练集结果,橙色虚线表示验证集结果,展示了模型在训练和验证过程中性能的逐步提升和收敛趋势。
(2)检测性能曲线分析

图6 Precision--Recall 曲线(PR 曲线)
该图展示了精确度与召回率的关系,曲线表明模型在"person"类别的精确度和召回率均表现出很高的性能,且整体mAP@0.5值为0.985,表现出优秀的检测能力。
(3)分类与识别效果分析

图7 混淆矩阵
该图展示了混淆矩阵,模型在"person"类别的预测表现优异,正确预测了6356个"person"实例,但也存在一定数量的误分类,其中142个"background"被误预测为"person",且有673个"person"被误分类为"background"。
(4)最终性能结果汇总

图8 YOLOv11 模型训练完成后的性能评估结果
从训练与验证结果可以看出,YOLO11 模型在150个训练周期后完成的验证结果,其中 mAP50 为 0.985,表示模型在检测"person"类别时具有非常高的准确性。同时,mAP50-95 为 0.851,表明在多个IoU阈值下模型也保持了较好的性能。这表明该模型在车站客流密度监测中具有较强的适应性和较高的精度,能够有效执行目标检测任务。
数据集须知
(1)数据来源:研究团队自主整理与优化,仅限科研与教学使用。
(2)数据结构:包含训练集、验证集和测试集,覆盖行人目标。
(3)文件格式:图像为 .jpg,标注为 YOLO 格式 .txt。
(4)使用要求:禁止未经授权的传播与商业使用。
(5)适用范围:轨道交通车站客流检测与分析研究。