12.1 主成分分析原理(PCA)

主成分分析步骤如下:

设有维数据

  1. 将原始数据按列组成列矩阵

  2. 将矩阵 的每一行进行零均值化;

  3. 求出协方差矩阵

  4. 求出协方差矩阵的特征值及对应的特征向量;

  5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前行组成矩阵

  6. 即为降维到维后的数据。

如果对线性代数的实对成矩阵的相似对角化熟悉的人可以很好的了解上面的步骤,根据线性代数的求解步骤如下(也可以是代码步骤,python的np有求解方法):

  1. 将原始数据按列组成列矩阵

  2. 将矩阵 的每一行进行零均值化;

这里的每一行零均值化就是每一行的元素减去该行的均值,均值可以用np.mean()求解。

3.求出协方差矩阵;这个矩阵实际上就是实对称矩阵。

4.求出协方差矩阵的特征值及对应的特征向量;

这里其实就是对实对称矩阵相似对角化,在相似对角化的过程中会得到特征值和对应的特征向量,得到的对角矩阵的对角线上的元素就是特征值,对角线以外的元素都为0。(当然,要对这组特征向量进行正交化,因为我们最终要的是正交向量,如果在这里不求,也可以在最后一步求个向量的正交向量,计算量肯定比现在求小,因为现在要求个向量,而最后只需要求个)。

  1. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前行组成矩阵

6.这里就是对特征值做从大到小的排序,可以用np.sorted()函数排序。

7.然后根据排序取前行的向量组成一个新的矩阵。

相关推荐
嘴贱欠吻!5 小时前
Flutter鸿蒙开发指南(七):轮播图搜索框和导航栏
算法·flutter·图搜索算法
Elastic 中国社区官方博客5 小时前
使用 Discord 和 Elastic Agent Builder A2A 构建游戏社区支持机器人
人工智能·elasticsearch·游戏·搜索引擎·ai·机器人·全文检索
张祥6422889045 小时前
误差理论与测量平差基础笔记十
笔记·算法·机器学习
qq_192779875 小时前
C++模块化编程指南
开发语言·c++·算法
2501_933329556 小时前
企业级AI舆情中台架构实践:Infoseek系统如何实现亿级数据实时监测与智能处置?
人工智能·架构
阿杰学AI6 小时前
AI核心知识70——大语言模型之Context Engineering(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·数据处理·上下文工程
赛博鲁迅6 小时前
物理AI元年:AI走出屏幕进入现实,88API为机器人装上“最强大脑“
人工智能·机器人
管牛牛6 小时前
图像的卷积操作
人工智能·深度学习·计算机视觉
云卓SKYDROID6 小时前
无人机航线辅助模块技术解析
人工智能·无人机·高科技·云卓科技