analysis_report

轨道交通站点功能识别分析报告


📋 目录

  1. 项目概述
  2. 分析方法
  3. 聚类效果评估
  4. 一周站点类型分布
  5. 周末模式深度分析
  6. 周五特殊模式分析
  7. 城市对比分析
  8. 结论与建议

1. 项目概述

1.1 项目背景

本项目旨在识别城市轨道交通站点的功能类型,通过分析客流时间序列数据进行聚类分类。

1.2 数据来源

  • 数据文件ALL.csv, IN.csv, OUT.csv
  • 覆盖城市:北京(BJ)、杭州(HZ)、南京(NJ)、上海(SH)、深圳(SZ)
  • 站点数量:953个
  • 时间覆盖:7天 × 96个15分钟时段

1.3 改进方案

针对周末客流模式与工作日差异显著的问题,采用工作日/周末分开建模策略:

日期类型 聚类数量 分类方法
工作日(周一~周四) 4类 基于早晚高峰模式
周五 3类 考虑夜间活跃
周末(周六/周日) 2类 基于客流波动程度

2. 分析方法

2.1 数据预处理

  1. 缺失值处理:使用列均值填充
  2. 负值转换:客流量负值转为0
  3. 低流量时段处理:凌晨零值使用相邻时段均值填充

2.2 标准化方法

采用按城市分别标准化,消除不同城市的规模差异影响。

2.3 聚类方法对比

方法 原理 效果
ED+KMeans 欧氏距离 + KMeans 效果最佳、最稳定
DTW+KMeans 动态时间规整 效果较差(降级实现)
SBD+KShape 基于形状的聚类 效果较差(降级实现)

2.4 分类规则

工作日分类(4类)
  • 通勤枢纽型:早晚高峰都明显
  • 居住型:早高峰 > 晚高峰(早晨外出上班)
  • 就业型:晚高峰 > 早高峰(晚上下班回家)
  • 混合型:无明显高峰差异
周五分类(3类)
  • 通勤型:早晚高峰明显
  • 夜间活跃型:周五晚上客流高
  • 混合型:无明显高峰
周末分类(2类)
  • 活跃型:客流波动大,下午/晚间有高峰(商业、旅游区)
  • 非活跃型:客流平稳较低(居住区)

3. 聚类效果评估

3.1 改进前后对比

日期 Silhouette(改进前) Silhouette(改进后) 提升幅度
周一~周四 0.29~0.32 0.29~0.32 -
周五 0.32 0.43 ⬆️ +34%
周六 0.31 0.66 ⬆️ +112%
周日 0.33 0.70 ⬆️ +112%

3.2 详细评估指标

日期 方法 Silhouette Calinski-Harabasz Davies-Bouldin
周一 ED+KMeans 0.291 466.09 1.284
周二 ED+KMeans 0.318 457.17 1.234
周三 ED+KMeans 0.321 457.14 1.241
周四 ED+KMeans 0.317 464.34 1.257
周五 ED+KMeans 0.426 569.90 1.070
周六 ED+KMeans 0.661 698.43 0.896
周日 ED+KMeans 0.698 721.74 0.842

结论:周末使用2类聚类后,聚类效果显著提升,Silhouette达到0.66~0.70,聚类质量极佳。


4. 一周站点类型分布

4.1 数量汇总

复制代码
日期      居住型   通勤枢纽型   混合型   通勤型   非活跃型   活跃型
───────────────────────────────────────────────────────────────
星期一     476      477        -       -        -         -
星期二     508      445        -       -        -         -
星期三     514      439        -       -        -         -
星期四     503      450        -       -        -         -
星期五      -        -        665     288       -         -
星期六      -        -         -       -       861       92
星期日      -        -         -       -       882       71

4.2 各城市工作日站点类型分布

星期一
城市 居住型 通勤枢纽型
BJ 62.8% 37.2%
HZ 67.1% 32.9%
NJ 64.1% 35.9%
SH 65.3% 34.7%
SZ 70.0% 30.0%
星期二
城市 居住型 通勤枢纽型
BJ 52.8% 47.2%
HZ 59.5% 40.5%
NJ 51.6% 48.4%
SH 51.4% 48.6%
SZ 50.0% 50.0%
星期三
城市 居住型 通勤枢纽型
BJ 52.4% 47.6%
HZ 57.0% 43.0%
NJ 56.3% 43.8%
SH 55.6% 44.4%
SZ 50.6% 49.4%
星期四
城市 居住型 通勤枢纽型
BJ 51.4% 48.6%
HZ 55.7% 44.3%
NJ 53.9% 46.1%
SH 54.2% 45.8%
SZ 50.6% 49.4%

4.3 趋势分析

  • 工作日:各城市居住型与通勤枢纽型分布相对均衡,居住型略占多数
  • 周五:混合型占主导(70%),通勤型占30%,反映周五提前进入周末模式
  • 周末:非活跃型占90%以上,活跃型仅占10%左右

5. 周末模式深度分析

5.1 为什么周末不应该是"通勤枢纽型"?

核心原因

特征 工作日 周末
高峰时段 早晚高峰明显 无明显高峰
客流模式 单向通勤流 双向生活流
功能定位 通勤为主 生活服务为主
客流来源 居住区↔就业区 商业/旅游区

5.2 周末分类结果(按城市统计)

星期六
城市 活跃型 非活跃型 活跃站点数
北京 (BJ) 9.4% 90.6% 27个
杭州 (HZ) 6.3% 93.7% 5个
南京 (NJ) 10.2% 89.8% 13个
上海 (SH) 9.4% 90.6% 27个
深圳 (SZ) 11.8% 88.2% 20个
合计 9.7% 90.3% 92个
星期日
城市 活跃型 非活跃型 活跃站点数
北京 (BJ) 7.6% 92.4% 22个
杭州 (HZ) 5.1% 94.9% 4个
南京 (NJ) 5.5% 94.5% 7个
上海 (SH) 7.3% 92.7% 21个
深圳 (SZ) 10.0% 90.0% 17个
合计 7.4% 92.6% 71个

5.3 活跃型站点特征

活跃型站点主要包括:

类型 典型站点位置 客流特征
🏪 商业中心 购物中心、商业街附近 下午购物高峰
🏛️ 旅游景点 博物馆、公园、景区附近 全天客流较高
🚉 交通枢纽 火车站、机场换乘站点 全天稳定客流
🎭 娱乐区域 电影院、餐饮集中区 晚间娱乐高峰

5.4 城市周末活跃度对比

城市 周六活跃率 周日活跃率 周末平均活跃率
深圳 (SZ) 11.8% 10.0% 10.9%
南京 (NJ) 10.2% 5.5% 7.8%
北京 (BJ) 9.4% 7.6% 8.5%
上海 (SH) 9.4% 7.3% 8.3%
杭州 (HZ) 6.3% 5.1% 5.7%

解读

  • 🥇 深圳:周末活跃度最高(10.9%),年轻城市特征明显
  • 🥈 北京/上海:活跃度中等(8.3-8.5%),商业旅游资源丰富
  • 🥉 南京:活跃度较低(7.8%)
  • 📉 杭州:周末活跃度最低(5.7%),可能与城市功能布局有关

6. 周五特殊模式分析

6.1 周五分类结果(按城市统计)

城市 混合型 通勤型 混合站点数 通勤站点数
北京 (BJ) 68.1% 31.9% 196个 92个
杭州 (HZ) 73.4% 26.6% 58个 21个
南京 (NJ) 71.1% 28.9% 91个 37个
上海 (SH) 73.3% 26.7% 211个 77个
深圳 (SZ) 64.1% 35.9% 109个 61个
合计 70.0% 30.0% 665个 288个

6.2 周五特征

  • 通勤型(30%):主要是核心商务区站点,仍有工作日通勤特征
  • 混合型(70%):大部分站点周五客流模式介于工作日与周末之间
  • 城市差异:深圳通勤型比例最高(35.9%),上海最低(26.7%)

7. 城市对比分析

7.1 工作日站点类型分布对比

城市 居住型比例(周平均) 通勤枢纽型比例(周平均) 特点
北京 (BJ) 54.8% 45.2% 职住分离较明显
杭州 (HZ) 59.8% 40.2% 居住型为主
南京 (NJ) 56.5% 43.5% 居住型为主
上海 (SH) 56.6% 43.4% 较均衡
深圳 (SZ) 55.3% 44.7% 较均衡

7.2 周末站点类型分布对比

城市 周六活跃率 周日活跃率 周末平均
深圳 (SZ) 11.8% 10.0% 10.9%
北京 (BJ) 9.4% 7.6% 8.5%
上海 (SH) 9.4% 7.3% 8.3%
南京 (NJ) 10.2% 5.5% 7.8%
杭州 (HZ) 6.3% 5.1% 5.7%

7.3 城市特征总结

城市 工作日特征 周末特征 综合评价
北京 职住分离较明显 活跃度中等 典型一线城市特征
杭州 居住型为主 活跃度最低 生活节奏较慢
南京 居住型为主 活跃度较低 偏向居住功能
上海 功能均衡 活跃度中等 国际化大都市
深圳 功能均衡 活跃度最高 年轻活力城市

8. 结论与建议

8.1 核心结论

结论 说明
分开建模效果显著 周末Silhouette从0.31提升到0.70
周末分类更合理 活跃型/非活跃型符合实际客流特征
周五模式特殊 3类聚类效果最佳,介于工作日与周末之间
工作日分类稳定 4类聚类持续有效
📊 周末活跃站点约10% 商业中心、旅游景点、交通枢纽
🏆 深圳周末最活跃 活跃率达10.9%,年轻城市特征
📉 杭州周末最安静 活跃率仅5.7%,生活节奏较慢

8.2 后续优化建议

  1. 细化活跃型分类:可进一步分为"商业型"、"旅游型"、"枢纽型"
  2. 增加POI数据:结合周边设施类型辅助分类
  3. 时间窗口优化:周末可使用下午时段(14:00-21:00)作为分析窗口
  4. 增加节假日分析:可分析节假日与普通周末的差异

8.3 成果产出

所有分析结果已保存到 results/ 目录:

文件类型 说明
station_classification_*.csv 每天的站点分类结果
evaluation_metrics_*.csv 每天的评估指标
cluster_centers_*.png 聚类中心曲线图
city_proportions_*.png 城市站点类型分布图
evaluation_metrics_all_days.csv 所有天评估指标汇总
station_type_summary_all_days.csv 站点类型汇总
city_comparison_report.txt 城市对比报告
analysis_report.md 完整分析报告

报告生成日期:2026年6月

分析站点数:953个

覆盖城市:北京、杭州、南京、上海、深圳

相关推荐
世优科技虚拟人1 小时前
3D卡通与写实数字人制作,AI数字人公司厂商重塑品牌形象升级
人工智能·ai数字人·3d数字人·大屏数字人·展厅数字人·卡通数字人
Ada's1 小时前
【LLM基础研究】工具02:MinerU
人工智能
彬鸿科技2 小时前
bhSDR Studio/Matlab入门指南(十二):AI神经网络训练(Resnet-SE) 实验界面全解析
人工智能·神经网络·matlab·软件无线电·sdr
TMT星球2 小时前
齐向东:AI时代,三类安全需求集中爆发
人工智能·安全
暗夜猎手-大魔王2 小时前
转载--Hermes Agent 05 | 记忆系统(上):内置记忆的冻结快照模式与 agent-curated 策展
人工智能
zhangfeng11332 小时前
如果模型h200训练好的模型 要部署到华为 升腾 950导致的误差怎么处理
人工智能·机器学习
贺国亚2 小时前
Agent 工程实践 · 生产落地 Playbook
java·人工智能·aigc
羊羊小栈2 小时前
非物质文化宣传系统(基于前后端Web开发)
前端·人工智能·毕业设计·大作业
J2虾虾2 小时前
Spring AI Alibaba - Structured Output 结构化输出
人工智能·python·spring