R语言主成分分析
之前介绍过怎么用SPSS进行主成分分析(PCA),已经忘了的朋友们可以到主页看看
今天主要介绍下R语言主成分分析的几种方法。都是入门级别,跟着我一步步走,一点都不难哈~
首先调用R语言自带的数据集,USArrests。这是个关于美国各州犯罪率的一个统计数据,已经很久远了,没啥实际研究价值,拿来做分析练手正好合适。

方法1.prcomp stats
prcomp这功能是R安装的时候就自带的,不用再特意安装其他包了,非常方便实用。

方法2.princomp
与prcomp功能一样,princomp也不用额外安装包了。实现的代码如下:



从以上两个图可以直观的看出,UrbanPop与其他三个变量离得挺远的,整体数据分成2个公因子就挺合理。具体来说,与Rape关系紧密的几个州为Michigan、Texas等,与Murder关系密切的州为Georgia等,与Assault关系紧密的州为Maryland等。
方法3.psych包principal
这种方法需要先安装psych包。安装也很简单,在Rstudio里一行命令搞定:


从这个选择主成分的碎石图里,也可以清晰看出,2是"拐点",选2,没错。


这结果就挺一目了然的,Murder、Assault、Rape属于RC1第一个公因子,他们在第一个公因子上得分都为正。UrbanPop属于第二个公因子。
以上就是用R语言进行主成分分析的三种方法,小伙伴们如果觉着有用,可以随意分享给更多的小伙伴,大家一起学习交流!