共享单车轨迹数据分析:以厦门市共享单车数据为例(八)

副标题:基于POI数据的站点综合评价------以厦门市为例(三)

什么是优劣解距离法(TOPSIS)?

优劣解距离法(Technique for Order Preference by Similarity to Ideal Solution,简称TOPSIS)是一种多属性决策分析方法,用于从多个备选方案中选择最优方案。它的基本思想是通过计算每个备选方案与理想解和负理想解的距离,来评估各个方案的优劣。

关键概念

  1. 理想解(Positive Ideal Solution, PIS):所有属性值都是最优的方案。比如,如果是最大化问题,理想解的所有属性值都是最大的;如果是最小化问题,理想解的所有属性值都是最小的。
  2. 负理想解(Negative Ideal Solution, NIS):所有属性值都是最差的方案。比如,如果是最大化问题,负理想解的所有属性值都是最小的;如果是最小化问题,负理想解的所有属性值都是最大的。

一、建模步骤
TOPSIS进行建模,大致分为以下五个步骤:

1、将原始矩阵正向化和标准化

2、计算指标权重(可选)

3、计算最优解和最劣解

4、计算各评价指标与最优及最劣向量之间的差距

5、计算综合得分

步骤详解

  1. 将原始矩阵正向化

    • 由于不同的属性可能有不同的优化方向(有的越大越好,有的越小越好),我们需要将所有属性值转换成统一的优化方向。具体做法是:
      • 效益型属性(越大越好):保持不变。
      • 成本型属性(越小越好):用最大值减去该属性值。
  2. 将正向化矩阵标准化

    • 为了消除不同属性之间的量纲差异,使所有属性值在同一个量级上进行比较,我们需要将每个属性值标准化,这里用了最大最小值归一化(Min-Max Normalization)是一种常用的数据标准化方法,用于将数据缩放到[0, 1]的范围内;

  3. 确定理想解和负理想解

    • 对于每个属性,根据其是否是最大化或最小化问题,确定理想解和负理想解的值。
    • 理想解(PIS):每个属性的最优值。
    • 负理想解(NIS):每个属性的最差值。
  4. 计算距离

    • 计算每个备选方案与理想解和负理想解的欧氏距离。
    • 与理想解的距离越小,表示该方案越接近最优。
    • 与负理想解的距离越大,表示该方案越远离最差。
  5. 计算相对接近度

    • 计算每个备选方案与理想解的相对接近度。相对接近度的计算公式为:

    • 是第 ( i ) 个方案与理想解(PIS)的距离。

      其中,是第 i 个方案与理想解的距离,是第 i 个方案与负理想解的距离。

    • 的值在0到1之间,值越接近1,表示该方案越优。

  6. 排序

    • 根据相对接近度对所有备选方案进行排序,选择相对接近度最大的方案作为最优方案。

我们依然以厦门市为例,来通过POI来研究厦门岛内以800m作为辐射范围的地铁站哪些地铁站发展的最好,当然这里只考虑了空间因素,时间因素上篇也提及到了,站点建成时间并不一致,会对站点发展程度有所影响,这里我们依然使用上篇文章用到的在线SPSS分析平台,

【放入正向坐标】:这里我们使用的坐标全部为正向指标也就是指标值越大评价越好的指标,【定类】选择站点,【变量权重】选择熵权法,当然这里也可以自定义权重,或者不设权重;

设置权重的目的是通过引入熵权法,考虑各类型POI(兴趣点)的重要程度,从而进行更科学的TOPSIS分析。在计算每个方案与理想解(D+)和负理想解(D-)的距离时,会将各属性值乘以其对应的权重值,以反映不同POI类型在决策中的实际影响。本文考虑了六类POI的权重情况,包括生活服务、医疗保健服务、商务住宅、科教文化服务、交通设施服务和公司企业。

分析结果表明,医疗保健服务的权重最大达到19.232%,即其对站点综合评价的影响最大;其次是交通设施和服务,分别为18.709%和17.593%。商务住宅和科教文化的权重相当,均为15.940%,而公司企业的权重最低只有12.601%。表明其影响程度相对较小。

因为篇幅原因,这里我们仅放一下前10名的一个综合得分指数;

结合GIS图和综合得分指数,我们可以更直观地理解站点的综合评价结果。从图中可以看出,前十名站点中有8座属于1号线,2号线和3号线各有一座。这些站点的综合得分指数分布状态与厦门人口分布和共享单车订单分布的耦合程度极高,具体表现为:

  1. 与人口分布的相关性:

    • 前十名站点主要集中在人口密集区域。例如,吕厝和湖滨东路等站点位于厦门市人口密度较高的地区,这些地区的综合得分指数较高。
    • 人口分布较多的区域,由于人口基数大,即使人们选择共享单车出行的概率不变,也会导致该地区的共享单车订单数量增加。这说明了人口分布对站点综合评价也存在一定相关性。
  2. 与共享单车订单分布的耦合:

    • 综合得分指数高的站点,如吕厝和湖滨东路,其周边的共享单车订单数量也较多。这表明这些站点不仅在POI数据上表现优秀,而且在共享单车实际使用中也存在大量需求。
    • 人口密集区域的共享单车订单数量多,反映了这些区域的交通需求旺盛。

关于这两部分的分析详见:共享单车轨迹数据分析:以厦门市共享单车数据为例(五)_基于共享单车轨迹数据的自行车道连续性评价及提升策略研究-CSDN博客

文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。

相关推荐
杰哥在此1 分钟前
Python知识点:如何使用Python进行卫星数据分析
开发语言·python·面试·数据分析·编程
B站计算机毕业设计超人2 分钟前
计算机毕业设计hadoop+hive航班预测系统 飞机票航班数据分析可视化大屏 机票预测 机票爬虫 飞机票推荐系统 大数据毕业设计
大数据·hive·hadoop·爬虫·机器学习·spark·数据可视化
电子海鸥4 分钟前
数据分析入门
数据分析·pandas
2402_8575834911 分钟前
Spring Boot驱动的在线房产租赁服务
java·服务器·spring boot
fasewer12 分钟前
第五章 linux实战-黑链
linux·运维·服务器
happycao12324 分钟前
Flink 02 | 英雄莫问出处 Flink丰富多彩的数据源
大数据·flink
Norris Huang26 分钟前
如何在 Amazon EMR 中运行 Flink CDC Pipeline Connector
大数据·flink
StarRocks_labs28 分钟前
饿了么基于Flink+Paimon+StarRocks的实时湖仓探索
大数据·flink·湖仓一体·paimon·lakehouse
weixin_4381973828 分钟前
LVS+keepalived整合负载均衡配置
服务器·负载均衡·lvs
seasugar30 分钟前
Flink集群部署
java·服务器·flink