共享单车轨迹数据分析:以厦门市共享单车数据为例(八)

副标题:基于POI数据的站点综合评价------以厦门市为例(三)

什么是优劣解距离法(TOPSIS)?

优劣解距离法(Technique for Order Preference by Similarity to Ideal Solution,简称TOPSIS)是一种多属性决策分析方法,用于从多个备选方案中选择最优方案。它的基本思想是通过计算每个备选方案与理想解和负理想解的距离,来评估各个方案的优劣。

关键概念

  1. 理想解(Positive Ideal Solution, PIS):所有属性值都是最优的方案。比如,如果是最大化问题,理想解的所有属性值都是最大的;如果是最小化问题,理想解的所有属性值都是最小的。
  2. 负理想解(Negative Ideal Solution, NIS):所有属性值都是最差的方案。比如,如果是最大化问题,负理想解的所有属性值都是最小的;如果是最小化问题,负理想解的所有属性值都是最大的。

一、建模步骤
TOPSIS进行建模,大致分为以下五个步骤:

1、将原始矩阵正向化和标准化

2、计算指标权重(可选)

3、计算最优解和最劣解

4、计算各评价指标与最优及最劣向量之间的差距

5、计算综合得分

步骤详解

  1. 将原始矩阵正向化

    • 由于不同的属性可能有不同的优化方向(有的越大越好,有的越小越好),我们需要将所有属性值转换成统一的优化方向。具体做法是:
      • 效益型属性(越大越好):保持不变。
      • 成本型属性(越小越好):用最大值减去该属性值。
  2. 将正向化矩阵标准化

    • 为了消除不同属性之间的量纲差异,使所有属性值在同一个量级上进行比较,我们需要将每个属性值标准化,这里用了最大最小值归一化(Min-Max Normalization)是一种常用的数据标准化方法,用于将数据缩放到[0, 1]的范围内;

  3. 确定理想解和负理想解

    • 对于每个属性,根据其是否是最大化或最小化问题,确定理想解和负理想解的值。
    • 理想解(PIS):每个属性的最优值。
    • 负理想解(NIS):每个属性的最差值。
  4. 计算距离

    • 计算每个备选方案与理想解和负理想解的欧氏距离。
    • 与理想解的距离越小,表示该方案越接近最优。
    • 与负理想解的距离越大,表示该方案越远离最差。
  5. 计算相对接近度

    • 计算每个备选方案与理想解的相对接近度。相对接近度的计算公式为:

    • 是第 ( i ) 个方案与理想解(PIS)的距离。

      其中,是第 i 个方案与理想解的距离,是第 i 个方案与负理想解的距离。

    • 的值在0到1之间,值越接近1,表示该方案越优。

  6. 排序

    • 根据相对接近度对所有备选方案进行排序,选择相对接近度最大的方案作为最优方案。

我们依然以厦门市为例,来通过POI来研究厦门岛内以800m作为辐射范围的地铁站哪些地铁站发展的最好,当然这里只考虑了空间因素,时间因素上篇也提及到了,站点建成时间并不一致,会对站点发展程度有所影响,这里我们依然使用上篇文章用到的在线SPSS分析平台,

【放入正向坐标】:这里我们使用的坐标全部为正向指标也就是指标值越大评价越好的指标,【定类】选择站点,【变量权重】选择熵权法,当然这里也可以自定义权重,或者不设权重;

设置权重的目的是通过引入熵权法,考虑各类型POI(兴趣点)的重要程度,从而进行更科学的TOPSIS分析。在计算每个方案与理想解(D+)和负理想解(D-)的距离时,会将各属性值乘以其对应的权重值,以反映不同POI类型在决策中的实际影响。本文考虑了六类POI的权重情况,包括生活服务、医疗保健服务、商务住宅、科教文化服务、交通设施服务和公司企业。

分析结果表明,医疗保健服务的权重最大达到19.232%,即其对站点综合评价的影响最大;其次是交通设施和服务,分别为18.709%和17.593%。商务住宅和科教文化的权重相当,均为15.940%,而公司企业的权重最低只有12.601%。表明其影响程度相对较小。

因为篇幅原因,这里我们仅放一下前10名的一个综合得分指数;

结合GIS图和综合得分指数,我们可以更直观地理解站点的综合评价结果。从图中可以看出,前十名站点中有8座属于1号线,2号线和3号线各有一座。这些站点的综合得分指数分布状态与厦门人口分布和共享单车订单分布的耦合程度极高,具体表现为:

  1. 与人口分布的相关性:

    • 前十名站点主要集中在人口密集区域。例如,吕厝和湖滨东路等站点位于厦门市人口密度较高的地区,这些地区的综合得分指数较高。
    • 人口分布较多的区域,由于人口基数大,即使人们选择共享单车出行的概率不变,也会导致该地区的共享单车订单数量增加。这说明了人口分布对站点综合评价也存在一定相关性。
  2. 与共享单车订单分布的耦合:

    • 综合得分指数高的站点,如吕厝和湖滨东路,其周边的共享单车订单数量也较多。这表明这些站点不仅在POI数据上表现优秀,而且在共享单车实际使用中也存在大量需求。
    • 人口密集区域的共享单车订单数量多,反映了这些区域的交通需求旺盛。

关于这两部分的分析详见:共享单车轨迹数据分析:以厦门市共享单车数据为例(五)_基于共享单车轨迹数据的自行车道连续性评价及提升策略研究-CSDN博客

文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。

相关推荐
CV学术叫叫兽18 分钟前
一站式学习:害虫识别与分类图像分割
学习·分类·数据挖掘
soulteary21 分钟前
突破内存限制:Mac Mini M2 服务器化实践指南
运维·服务器·redis·macos·arm·pika
爱吃青椒不爱吃西红柿‍️1 小时前
华为ASP与CSP是什么?
服务器·前端·数据库
PersistJiao1 小时前
在 Spark RDD 中,sortBy 和 top 算子的各自适用场景
大数据·spark·top·sortby
2301_811274311 小时前
大数据基于Spring Boot的化妆品推荐系统的设计与实现
大数据·spring boot·后端
Yz98761 小时前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发
青云交1 小时前
大数据新视界 -- 大数据大厂之 Hive 数据导入:多源数据集成的策略与实战(上)(3/ 30)
大数据·数据清洗·电商数据·数据整合·hive 数据导入·多源数据·影视娱乐数据
武子康1 小时前
大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结
java·大数据·数据仓库·hive·hadoop·sql·hdfs
武子康2 小时前
大数据-231 离线数仓 - DWS 层、ADS 层的创建 Hive 执行脚本
java·大数据·数据仓库·hive·hadoop·mysql
时差9532 小时前
Flink Standalone集群模式安装部署
大数据·分布式·flink·部署