analysis_report

轨道交通站点功能识别分析报告


📋 目录

  1. 项目概述
  2. 分析方法
  3. 聚类效果评估
  4. 一周站点类型分布
  5. 周末模式深度分析
  6. 周五特殊模式分析
  7. 城市对比分析
  8. 结论与建议

1. 项目概述

1.1 项目背景

本项目旨在识别城市轨道交通站点的功能类型,通过分析客流时间序列数据进行聚类分类。

1.2 数据来源

  • 数据文件ALL.csv, IN.csv, OUT.csv
  • 覆盖城市:北京(BJ)、杭州(HZ)、南京(NJ)、上海(SH)、深圳(SZ)
  • 站点数量:953个
  • 时间覆盖:7天 × 96个15分钟时段

1.3 改进方案

针对周末客流模式与工作日差异显著的问题,采用工作日/周末分开建模策略:

日期类型 聚类数量 分类方法
工作日(周一~周四) 4类 基于早晚高峰模式
周五 3类 考虑夜间活跃
周末(周六/周日) 2类 基于客流波动程度

2. 分析方法

2.1 数据预处理

  1. 缺失值处理:使用列均值填充
  2. 负值转换:客流量负值转为0
  3. 低流量时段处理:凌晨零值使用相邻时段均值填充

2.2 标准化方法

采用按城市分别标准化,消除不同城市的规模差异影响。

2.3 聚类方法对比

方法 原理 效果
ED+KMeans 欧氏距离 + KMeans 效果最佳、最稳定
DTW+KMeans 动态时间规整 效果较差(降级实现)
SBD+KShape 基于形状的聚类 效果较差(降级实现)

2.4 分类规则

工作日分类(4类)
  • 通勤枢纽型:早晚高峰都明显
  • 居住型:早高峰 > 晚高峰(早晨外出上班)
  • 就业型:晚高峰 > 早高峰(晚上下班回家)
  • 混合型:无明显高峰差异
周五分类(3类)
  • 通勤型:早晚高峰明显
  • 夜间活跃型:周五晚上客流高
  • 混合型:无明显高峰
周末分类(2类)
  • 活跃型:客流波动大,下午/晚间有高峰(商业、旅游区)
  • 非活跃型:客流平稳较低(居住区)

3. 聚类效果评估

3.1 改进前后对比

日期 Silhouette(改进前) Silhouette(改进后) 提升幅度
周一~周四 0.29~0.32 0.29~0.32 -
周五 0.32 0.43 ⬆️ +34%
周六 0.31 0.66 ⬆️ +112%
周日 0.33 0.70 ⬆️ +112%

3.2 详细评估指标

日期 方法 Silhouette Calinski-Harabasz Davies-Bouldin
周一 ED+KMeans 0.291 466.09 1.284
周二 ED+KMeans 0.318 457.17 1.234
周三 ED+KMeans 0.321 457.14 1.241
周四 ED+KMeans 0.317 464.34 1.257
周五 ED+KMeans 0.426 569.90 1.070
周六 ED+KMeans 0.661 698.43 0.896
周日 ED+KMeans 0.698 721.74 0.842

结论:周末使用2类聚类后,聚类效果显著提升,Silhouette达到0.66~0.70,聚类质量极佳。


4. 一周站点类型分布

4.1 数量汇总

复制代码
日期      居住型   通勤枢纽型   混合型   通勤型   非活跃型   活跃型
───────────────────────────────────────────────────────────────
星期一     476      477        -       -        -         -
星期二     508      445        -       -        -         -
星期三     514      439        -       -        -         -
星期四     503      450        -       -        -         -
星期五      -        -        665     288       -         -
星期六      -        -         -       -       861       92
星期日      -        -         -       -       882       71

4.2 各城市工作日站点类型分布

星期一
城市 居住型 通勤枢纽型
BJ 62.8% 37.2%
HZ 67.1% 32.9%
NJ 64.1% 35.9%
SH 65.3% 34.7%
SZ 70.0% 30.0%
星期二
城市 居住型 通勤枢纽型
BJ 52.8% 47.2%
HZ 59.5% 40.5%
NJ 51.6% 48.4%
SH 51.4% 48.6%
SZ 50.0% 50.0%
星期三
城市 居住型 通勤枢纽型
BJ 52.4% 47.6%
HZ 57.0% 43.0%
NJ 56.3% 43.8%
SH 55.6% 44.4%
SZ 50.6% 49.4%
星期四
城市 居住型 通勤枢纽型
BJ 51.4% 48.6%
HZ 55.7% 44.3%
NJ 53.9% 46.1%
SH 54.2% 45.8%
SZ 50.6% 49.4%

4.3 趋势分析

  • 工作日:各城市居住型与通勤枢纽型分布相对均衡,居住型略占多数
  • 周五:混合型占主导(70%),通勤型占30%,反映周五提前进入周末模式
  • 周末:非活跃型占90%以上,活跃型仅占10%左右

5. 周末模式深度分析

5.1 为什么周末不应该是"通勤枢纽型"?

核心原因

特征 工作日 周末
高峰时段 早晚高峰明显 无明显高峰
客流模式 单向通勤流 双向生活流
功能定位 通勤为主 生活服务为主
客流来源 居住区↔就业区 商业/旅游区

5.2 周末分类结果(按城市统计)

星期六
城市 活跃型 非活跃型 活跃站点数
北京 (BJ) 9.4% 90.6% 27个
杭州 (HZ) 6.3% 93.7% 5个
南京 (NJ) 10.2% 89.8% 13个
上海 (SH) 9.4% 90.6% 27个
深圳 (SZ) 11.8% 88.2% 20个
合计 9.7% 90.3% 92个
星期日
城市 活跃型 非活跃型 活跃站点数
北京 (BJ) 7.6% 92.4% 22个
杭州 (HZ) 5.1% 94.9% 4个
南京 (NJ) 5.5% 94.5% 7个
上海 (SH) 7.3% 92.7% 21个
深圳 (SZ) 10.0% 90.0% 17个
合计 7.4% 92.6% 71个

5.3 活跃型站点特征

活跃型站点主要包括:

类型 典型站点位置 客流特征
🏪 商业中心 购物中心、商业街附近 下午购物高峰
🏛️ 旅游景点 博物馆、公园、景区附近 全天客流较高
🚉 交通枢纽 火车站、机场换乘站点 全天稳定客流
🎭 娱乐区域 电影院、餐饮集中区 晚间娱乐高峰

5.4 城市周末活跃度对比

城市 周六活跃率 周日活跃率 周末平均活跃率
深圳 (SZ) 11.8% 10.0% 10.9%
南京 (NJ) 10.2% 5.5% 7.8%
北京 (BJ) 9.4% 7.6% 8.5%
上海 (SH) 9.4% 7.3% 8.3%
杭州 (HZ) 6.3% 5.1% 5.7%

解读

  • 🥇 深圳:周末活跃度最高(10.9%),年轻城市特征明显
  • 🥈 北京/上海:活跃度中等(8.3-8.5%),商业旅游资源丰富
  • 🥉 南京:活跃度较低(7.8%)
  • 📉 杭州:周末活跃度最低(5.7%),可能与城市功能布局有关

6. 周五特殊模式分析

6.1 周五分类结果(按城市统计)

城市 混合型 通勤型 混合站点数 通勤站点数
北京 (BJ) 68.1% 31.9% 196个 92个
杭州 (HZ) 73.4% 26.6% 58个 21个
南京 (NJ) 71.1% 28.9% 91个 37个
上海 (SH) 73.3% 26.7% 211个 77个
深圳 (SZ) 64.1% 35.9% 109个 61个
合计 70.0% 30.0% 665个 288个

6.2 周五特征

  • 通勤型(30%):主要是核心商务区站点,仍有工作日通勤特征
  • 混合型(70%):大部分站点周五客流模式介于工作日与周末之间
  • 城市差异:深圳通勤型比例最高(35.9%),上海最低(26.7%)

7. 城市对比分析

7.1 工作日站点类型分布对比

城市 居住型比例(周平均) 通勤枢纽型比例(周平均) 特点
北京 (BJ) 54.8% 45.2% 职住分离较明显
杭州 (HZ) 59.8% 40.2% 居住型为主
南京 (NJ) 56.5% 43.5% 居住型为主
上海 (SH) 56.6% 43.4% 较均衡
深圳 (SZ) 55.3% 44.7% 较均衡

7.2 周末站点类型分布对比

城市 周六活跃率 周日活跃率 周末平均
深圳 (SZ) 11.8% 10.0% 10.9%
北京 (BJ) 9.4% 7.6% 8.5%
上海 (SH) 9.4% 7.3% 8.3%
南京 (NJ) 10.2% 5.5% 7.8%
杭州 (HZ) 6.3% 5.1% 5.7%

7.3 城市特征总结

城市 工作日特征 周末特征 综合评价
北京 职住分离较明显 活跃度中等 典型一线城市特征
杭州 居住型为主 活跃度最低 生活节奏较慢
南京 居住型为主 活跃度较低 偏向居住功能
上海 功能均衡 活跃度中等 国际化大都市
深圳 功能均衡 活跃度最高 年轻活力城市

8. 结论与建议

8.1 核心结论

结论 说明
分开建模效果显著 周末Silhouette从0.31提升到0.70
周末分类更合理 活跃型/非活跃型符合实际客流特征
周五模式特殊 3类聚类效果最佳,介于工作日与周末之间
工作日分类稳定 4类聚类持续有效
📊 周末活跃站点约10% 商业中心、旅游景点、交通枢纽
🏆 深圳周末最活跃 活跃率达10.9%,年轻城市特征
📉 杭州周末最安静 活跃率仅5.7%,生活节奏较慢

8.2 后续优化建议

  1. 细化活跃型分类:可进一步分为"商业型"、"旅游型"、"枢纽型"
  2. 增加POI数据:结合周边设施类型辅助分类
  3. 时间窗口优化:周末可使用下午时段(14:00-21:00)作为分析窗口
  4. 增加节假日分析:可分析节假日与普通周末的差异

8.3 成果产出

所有分析结果已保存到 results/ 目录:

文件类型 说明
station_classification_*.csv 每天的站点分类结果
evaluation_metrics_*.csv 每天的评估指标
cluster_centers_*.png 聚类中心曲线图
city_proportions_*.png 城市站点类型分布图
evaluation_metrics_all_days.csv 所有天评估指标汇总
station_type_summary_all_days.csv 站点类型汇总
city_comparison_report.txt 城市对比报告
analysis_report.md 完整分析报告

报告生成日期:2026年6月

分析站点数:953个

覆盖城市:北京、杭州、南京、上海、深圳

相关推荐
武子康7 分钟前
调查研究-192 AI Agent 之间也需要“信任“:把多 Agent 信任变成可测指标
人工智能·openai·agent
Smoothcloud_润云28 分钟前
Hermes Agent 的上下文记忆机制:一个开源 Agent 是怎么"记住"你的
人工智能·agent·gpu
早点睡啊29 分钟前
精读 LangChain 官方文档(一)总览、安装与快速开始:从 create_agent 跑通第一个智能体
人工智能
牛奶1 小时前
AI时代裁员后:清零是君子豹变
人工智能·程序员
武子康1 小时前
调查研究-191 SenseVoice 不只是 ASR:把语音从“转文字“升级成“理解状态“
人工智能·深度学习·openai
程序员cxuan2 小时前
Codex 会把磁盘给烧了?完整复盘来了!
人工智能·后端·程序员
甲维斯2 小时前
字节版“Codex”初体验,Seed 2.1pro所有人免费用!
人工智能·ai编程·豆包marscode
半个落月3 小时前
从 Tokenization 到 Embedding:用 Node.js 搞懂大模型为什么先“分词”再“向量化”
人工智能·node.js
vanuan3 小时前
MCP协议实战(Java版):用Spring Boot让AI直接查你的数据库
人工智能
雪隐4 小时前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python