Amos路径分析得到结果后,如何基于精度指标加以模型优化?

本文介绍Amos 软件进行路径分析时,依据模型精度指标 参数,对得到的模型结果进行再次调整的方法。

前面三篇博客,分别对Amos的基本操作与模型、参数等加以详细介绍,其中包括# Amos路径分析方法与所得结果参数介绍,以及# Amos路径分析的结果中各个参数都是什么意思?,还有# Amos路径分析的拟合指标如何评判模型的优劣?

得到路径分析模型以后,并不一定可以获得具有很好拟合优度的模型结果,因此我们需要对模型加以修正。本文就结合路径分析模型拟合优度的相关参数(具体请见博客3),对模型加以修正。

1 模型验证

首先,我们需要用Amos软件所输出的各项模型拟合程度指标参数,对所得模型的拟合情况加以验证,看看模型是否符合要求。那么按照上述# Amos路径分析的拟合指标如何评判模型的优劣?所提到的标准,对模型结果加以衡量。

先看卡方自由度比。可以看到,我们所建立模型的卡方自由度比为4.138。而其值处于1至3之间才表示模型拟合度可以接受。因此,卡方自由度比没有满足。

再看GFI、AGFI,模型对应的值分别为0.971与0.779。而二者大于0.9时可以认为模型拟合程度较理想。因此,GFI满足要求,而AGFI未满足要求。

再看RMR、RMSEA,模型对应的值分别为76.691与0.173。而前者小于0.05时,说明模型拟合优度可以接受;后者小于0.05(也有认为小于0.10)时,说明模型拟合程度可以接受,大于0.10则说明模型拟合程度不佳。因此,二者均不满足要求,且RMR远远超出了可以接受的范围。

再看CFI,模型对应的值为0.930。而其数值大于0.9时认为模型拟合程度可以接受。因此,CFI满足要求。

再看NFI、TLI,模型对应的值分别为0.917与0.649。而二者均在大于0.9时认为模型拟合程度可以接受。因此,NFI满足要求,而TLI不满足要求。

再看ECVI,模型对应的值为0.326。而其数值越小,表明模型内不同样本间的一致性越高,说明这一模型具有预测效度,即模型可以用于不同的样本。因此,ECVI应该也属于不太满足。

再看AIC、BIC、CAIC,模型对应的值分别为34.276,68.901与81.801。而三者数值越小表明模型拟合程度越好。因此,AIC、BIC、CAIC也不满足。

综上所述,模型整体的拟合情况并不理想,需要对模型加以修正、调整。

2 模型修正与调整

以上分析,均为Amos软件基于我们所建立的模型实际情况中的数据 分别对应的变量关系矩阵------这两个矩阵的差异,从而加以模型衡量的。模型拟合情况不理想,也就是差异比较大,那么我们首先就可以依据Amos软件对于上述差异的分析(例如差异出现在哪里),从而对模型加以调整。

2.1 基于MI修正

2.1.1 MI修正原理

# Amos路径分析的结果中各个参数都是什么意思?的2.10部分,我们已经对MI有了初步的介绍。MI在输出结果中的显示与当初"Output"中我们勾选的"Modification indices"选项与其右侧的阈值有关。

MI(Modification Index),即修正指标,其包括协方差修正指标、方差修正指标与回归系数修正指标。

那么,上图中这些表格该怎么看呢?首先,表格中出现的箭头表示,我们所建立的模型没有引入、而实际上确实具有一定相关关系的变量。例如,我自己建立的模型如下图(将模型与以上表格放在一起,方便大家查看):

由上图可知,在残差e1与e4之间,我原本的模型中没有建立二者的联系;但是表格中出现了二者的关系,并且还是双向关系(双箭头);同样的,下方的表格表示RoDen也对BC具有影响,而这也是我在当初模型建立过程中没有引入的。

在这里,相信大家对初"Output"中我们勾选的"Modification indices"选项右侧的阈值也有了了解------这一阈值就是为了确定,在最终的MI结果表格中,MI数值大于多少的关系才会出现在表格中。我当初的阈值设置了4,那么所有MI大于4且没有在我自己的模型中出现的关系都要在MI表格中显示出来。

接下来,我们再看:MI表格中,MI具体的含义,以及其右侧的"Par Change"具体是什么呢?首先,MI的含义就是:如果将其左侧对应的因果关系在路径图中加上的话,模型的整体卡方值会下降的数值。例如本文中,如果我们将RoDen对BC具有的影响加入到路径图中,那么模型整体的卡方值数值就会下降4.482。

其次,"Par Change"的含义是要结合实际情况来的。首先,对于残差之间的"Par Change",其代表将对应关系引入路径图后两个残差之间的协方差会改变的大致数值;而对于实际变量之间的"Par Change",其代表将对应关系引入路径图后这一关系中对应回归系数的大致的改变数值,其正负就代表着这一关系是正相关还是负相关。例如,如果我们将表中的残差e1与e4关系引入路径图,那么这两个残差的协方差就会变为22.004左右;如果我们将RoDen对BC具有的影响加入到路径图中,那么这两个变量对应关系的回归系数就会在0.062左右。

当然,如上所述,MI表格中所显示的具体数值都是并不完全确定的,而实一个大致的数据。因为其只考虑了单个路径的影响,而不是整体模型的全部影响。

2.1.2 MI修正方法

基于MI的修正方法比较简单:就是根据Amos软件所得输出结果,将以上表格中涉及到的路径选择性添加至多一条至我们原有的模型路径图中。

好的,我们先不管为什么是至多 ,先探讨要注意这里是仅仅添加一条即可,即逐个修正。这是因为,添加了一条之后重新运行模型,那么原本表格中涉及到的其他路径可能就不会再有这么高的MI了(因为模型中各对两两关系都是相互影响的,有的时候会有一种此消彼长的态势)。例如,假如我首先把本文上图中残差e1与e4之间的关系加入到路径图,重新执行模型,那么很有可能所得到的新的MI表格中,RoDen对BC具有的影响关系也就消失了。

然后,为什么是至多一条呢?是不是可以一条都不添加呢?没错。在添加的过程中,我们务必也要注意MI表格中所列出的关系的实际情况,看看他是否符合常理,符合不符合我们的科学认知,千万不能犯"唯数据主义"的错误。例如,上述MI表格中列出RoDen(道路密度)对BC(一种土壤碳含量指标)具有影响关系,并且"Par Change"大于零说明其是正相关关系,说明这个因果关系就符合常理------道路密集,交通就比较频繁,日积月累,土壤中碳含量就会上升,这是符合我们认知的;而假如MI表格中列出的是"身高对体重具有负相关关系""住院时长对住院总花费具有负相关关系"等等这种不太符合常理的关系,我们就不要再将其盲目添加进入路径图中了。

那么,我们选择哪一条关系添加到路径图中呢?基于上述分析,我们可以结合"MI数值"与"实际认知"两个角度来判断。首先,我们看到残差e1与e4之间的相互关系、RoDen对BC具有的影响关系MI值分别为5.198、4.482,从数值大小的角度来说前者更符合修正的需要。但是,结合实际认知与经验,确实RoDen会对BC具有较为明显的促进作用。另一方面,前者MI值较之后者也并不是大得很明显,那么综合"MI数值"与"实际认知"两个角度,我们就选择将后者,也就是RoDen对BC具有的影响关系加入到模型中。

在这里有一点需要注意:强烈建议大家采用如下的方法新建模型。首先,在下图所示位置双击红色区域这一栏。

打开模型管理界面。

点击下方的"New",新建一个模型并自己起一个名字,随后点击"Close"。可以看到,这样子我们在原有文件的基础上新建了一个模型,我们只需要在新模型的基础上修正即可。这样子就可以保证原有模型不破坏,从而更方便地实现新旧模型对比、回退至原有模型等。用数据分析大佬草堂君的介绍来说,这种方法叫做"单文件(即在一个".awm"文件中)多模型设置"。

综上,我们修正模型,如下图;其中,第一幅图为原有模型,第二幅图为修正后的模型。

没错,第二幅图的模型较之前者就是多出了由RoDen至BC的一条箭头。但是要注意,大家此时轮换查看刚刚新建的模型与原有模型,会发现其路径图都是修改后的。没错,确实是这个样子,我们还需要进行一个步骤:在模型路径图中,双击我们刚刚新建的那个关系(就是由RoDen至BC的一条箭头,然后在其下方"Regression weight"位置随便起一个名字,这个名字就是RoDen至BC这一个关系对应的回归系数的名字。我这里起名叫做"MyWeight"。

接下来,我们打开原有模型。

在上图第二个位置(也就是参数约束区域)下方的空白中输入:

m 复制代码
MyWeight=0

其中,MyWeight就是我们刚刚给RoDen至BC这一个关系对应的回归系数起的名字。相信大家也明白了:对原有模型这一回归系数限定为0,相当于就是没有建立RoDen与BC二者的关系;而新模型中,我们没有对模型限定这一回归系数为0,因此新模型中RoDen与BC二者的关系就是建立的。可以看下图的对比。

可见新模型就没有这一条约束。

完成模型修正,我们就可以重新运行模型了。接下来查看模型的各个拟合情况衡量参数,例如卡方自由度比:

可以看到,新模型(New Numbe)较之原有模型,在卡方自由度比方面有很大改进。

其他参数也依据同样方法即可查看并实现与原有模型的对比哦~

2.2 基于已有路径修正

如果说上述MI修正方法是基于模型中还没有的路径加以修正,那么本部分这一方法就是结合模型中已有的路径进行,通过将它们删除从而实现模型修正。

那么如何区分模型中已有且需要删除的路径呢?

2.2.1 显著性水平较低路径

如下图,红色部分对应的路径都是显著性水平明显很低的路径,其P数值都远远大于0.05,因此这样的路径可以直接在模型中删除。

2.2.2 正负关系不合理路径

我们还看上面那一幅图。基于# Amos路径分析的结果中各个参数都是什么意思?,我们已经知道"Estimate"代表的是回归系数,那么我们可以根据表格中不正常的回归系数符号判定有问题的路径。例如,假如在表格中出现了"住院时长"与"最终住院费用"之间的回归系数带着负号这样的情况,这就和正常情况有些出入,不符合我们的常规认知,因此就可以把这样的路径直接删除。

基于以上方法,将需要删除的路径去掉后,重新执行模型即可。

例如,我们以本文2.2.1部分的图为例,删除图中红色区域表示的路径。得到修正后的模型如下:

得到模型的卡方自由度比:

而删除这两条路径前:

可以看到,删除这两条路径后,"Default model"(也就是前文2.1部分修正前的模型)与"New Number"(也就是前文2.1部分修正后的模型)的卡方自由度比都在1到3的范围内,相当于是在本文2.1部分(基于MI值修正)的基础上进一步完善了模型的拟合优度。

综上,通过不断地修正、重新运行模型,使得模型越来越满足我们的实际需要。

相关推荐
落魄君子4 小时前
GA-BP分类-遗传算法(Genetic Algorithm)和反向传播算法(Backpropagation)
算法·分类·数据挖掘
落魄君子4 小时前
ELM分类-单隐藏层前馈神经网络(Single Hidden Layer Feedforward Neural Network, SLFN)
神经网络·分类·数据挖掘
Altair澳汰尔8 小时前
数据分析和AI丨知识图谱,AI革命中数据集成和模型构建的关键推动者
人工智能·算法·机器学习·数据分析·知识图谱
qingyunliushuiyu14 小时前
企业为何需要可视化数据分析系统
数据挖掘·数据分析·数据采集·数据可视化·数据分析系统
dundunmm16 小时前
数据挖掘之认识数据
人工智能·机器学习·信息可视化·数据挖掘
chenchihwen16 小时前
数据分析时的json to excel 转换的好用小工具
数据分析·json·excel
江南野栀子1 天前
数据可视化-1. 折线图
信息可视化·数据挖掘·数据分析
反方向的钟儿1 天前
非结构化数据分析与应用(Unstructured data analysis and applications)(pt3)图像数据分析1
人工智能·计算机视觉·数据分析
感谢地心引力1 天前
【数据分析】层次贝叶斯
机器学习·数据分析·概率论
【建模先锋】1 天前
故障诊断 | 一个小创新:特征提取+KAN分类
人工智能·分类·数据挖掘