【SPSS/EXCEl】主成分分析构建__综合评价指数

学习过程中实验操作的记录

1.数据准备和标准化:

(1)区分正负相关性:判断每个因子是正向指标还是负向指标,计算每个的最大值和最小值

(2) 标准化: Min-Max标准化

Min-Max标准化(最大最小值法): 将数据映射到指定的区间(通常是[0, 1])

标准化值=最大值−最小值/原始值−最小值​

用Excel中的函数计算得

对于正向指标,按照每个数据减去最小值,再除以最大值减去最小值进行标准化

固定的数值加上$

不加$,下拉可能会出现问题

Excel $ 绝对引用的使用规则

  1. 完全固定(绝对引用)

    $A$1无论下拉还是右拉,始终引用 A1

  2. 仅固定列

    $A1拖动时,列 A 不变,行号会随下拉变化

  3. 仅固定行

    A$1拖动时,行 1 不变,列号会随右拉变化

对于负向指标,需要进行反向处理,反向处理值=最大值−原始值

处理后部分数据如下图:

2.主成分分析/因子分析:

在处理多维度的数据时,主成分分析(PCA)或因子分析(FA)能够帮助减少数据的维度,将多个相关指标提取为少数几个综合性的因子。这些因子可以有效表示社会弱势性。

  • 主成分分析:通过求解协方差矩阵,提取出主要的成分(因子),这些成分能够解释原始数据中大部分的方差。结果会提供每个因子的权重,帮助你理解每个因子对总社会弱势性的贡献。

  • 因子分析:与主成分分析类似,因子分析通过提取数据中的潜在因子,减少维度。主要不同在于,因子分析关注于因子背后的结构,而主成分分析主要关注最大化方差

用SPSS软件对各项原始指标进行数量特征分析

导入数据:

表示数值型变量

进入因子分析界面

点击 Analyze(分析) → Dimension Reduction(降维) → Factor(因子分析)

Factor Analysis(因子分析)窗口中 ,将需要进行主成分分析的数值型变量移动到 Variables(变量) 框内

设置勾选

点击 OK 运行主成分分析,SPSS 将输出结果

得到:

判断原始数据是否适合进行因子分析:

KMO(Kaiser-Meyer-Olkin)检验是检验原始数据是否适合做因子分析的一个指标。KMO值大于0.7通常认为数据适合做因子分析,意味着变量之间有较强的相关性。

KMO值的计算基于变量之间的相关性矩阵和偏相关性矩阵。具体来说,KMO统计量的值是所有变量之间的相关性与偏相关性的比值。

  • KMO值大于0.7:数据适合进行因子分析

Bartlett球形检验:Bartlett球形检验用于检验样本数据的相关性矩阵是否为单位矩阵

检验数据中的各个变量是否存在足够的相关性,以支持因子分析。单位矩阵的特点是对角线元素为1,非对角线元素为0,表示所有变量之间无相关性

显著性水平检验(Bartlett球形检验)用于检验原始数据的相关性是否显著,如果显著性水平小于或等于0.05,说明数据适合进行因子分析

总方差解释表,它描述了每个主成分对数据总方差的贡献情况

前四个主成分的特征值大于1(5.560、2.736、1.379、1.012),因此这四个主成分解释了数据的大部分方差,总计解释了82.208%的方差。

第一个主成分主要反映的是教育水平和经济收入

第二个主成分主要反映的是人口老龄化

第三个主成分主要与教育水平较低相关

四个主成分主要与居住条件差相关

旋转后的成分矩阵 ,我们可以分析每个主成分与原始变量之间的关系

旋转后的成分矩阵用于使得每个主成分尽可能地与少数几个原始变量高度相关

每个主成分的特征: 每一列代表一个主成分,每一行代表一个原始变量。每个数值表示原始变量在该主成分上的载荷(即贡献度)。载荷越大,说明该变量对该主成分的影响越大

每个主成分找>0.7的原始变量

成分得分系数矩阵(Component Score Coefficient Matrix) 是主成分分析(PCA)中的一个重要组成部分,用于描述每个原始变量在主成分中的贡献。它的作用是在将数据转换为主成分空间后,帮助我们理解原始变量如何与每个主成分相关

**成分得分系数矩阵:**可以通过将每个原始变量与相应的主成分得分系数相乘,来计算每个主成分的得分

从中得到前四个主成分载荷>0.7的原始变量

计算每个样本的主成分得分

为了计算每个样本的主成分得分,需要将每个样本的原始数据乘以相应的成分得分系数矩阵。

假设样本数据为 Xa(每一列是一个样本),成分得分系数 Ai,那么主成分得分 Z就是:

Z=Xa×Ai

其中 Z 是每个样本在四个主成分上的得分

可以在Excel上计算

CI=ci与下面这四个系数对应相乘的和,

总的CI值 = 成分1的权重 * c1的值 + 成分2的权重 * c2的值 + 成分3的权重 * c3的值 + ------成分4的权重 * c4的值

在excel上可以完成

为了得到综合的社会弱势性评价指数(CI),需要先进行主成分分析或因子分析,目的是将多维的社会经济指标转化为少数几个具有代表性的综合性因子

将这个文件另存为.xls文件

在arcgis里面关联上

ArcGIS 不支持 .xlsx 格式,确保文件保存为 .xls


基于上面操作再用ArcGIS软件进行空间自相关分析

相关推荐
jimin_callon2 分钟前
VBA第三十九期 VBA自动把工作表转换成PPT
python·excel·vba·wps·deepseek
互联网上的猪3 小时前
excel的逻辑类型函数(主要包括if、and、or、not、xor、iserror、iferror、true、false、ifs、ifna、switch)
笔记·学习·excel
destinyol3 小时前
Excel流式多线程带进度条功能的导入框架
java·spring boot·excel
互联网上的猪7 小时前
Excel计数、求和、统计、计算类函数
笔记·学习·excel
涛思数据(TDengine)7 小时前
时序数据库 TDengine × Excel:一份数据,两种效率
excel·时序数据库·tdengine
PacosonSWJTU16 小时前
python基础-13-处理excel电子表格
开发语言·python·excel
开开心心就好20 小时前
解决 PDF 难题:批量处理、文档清理与自由拆分合并
java·学习·eclipse·pdf·word·excel·生活
hello_simon1 天前
PDF转换:在线将PDF转PPT并且可编辑文字图片,超快速转换软件,无需下载
pdf·html·excel·pdf转html·excel转pdf格式
1111Alisa1 天前
数据分析-Excel-学习笔记Day1
学习·数据分析·excel