12.1 主成分分析原理(PCA)

主成分分析步骤如下:

设有维数据

  1. 将原始数据按列组成列矩阵

  2. 将矩阵 的每一行进行零均值化;

  3. 求出协方差矩阵

  4. 求出协方差矩阵的特征值及对应的特征向量;

  5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前行组成矩阵

  6. 即为降维到维后的数据。

如果对线性代数的实对成矩阵的相似对角化熟悉的人可以很好的了解上面的步骤,根据线性代数的求解步骤如下(也可以是代码步骤,python的np有求解方法):

  1. 将原始数据按列组成列矩阵

  2. 将矩阵 的每一行进行零均值化;

这里的每一行零均值化就是每一行的元素减去该行的均值,均值可以用np.mean()求解。

3.求出协方差矩阵;这个矩阵实际上就是实对称矩阵。

4.求出协方差矩阵的特征值及对应的特征向量;

这里其实就是对实对称矩阵相似对角化,在相似对角化的过程中会得到特征值和对应的特征向量,得到的对角矩阵的对角线上的元素就是特征值,对角线以外的元素都为0。(当然,要对这组特征向量进行正交化,因为我们最终要的是正交向量,如果在这里不求,也可以在最后一步求个向量的正交向量,计算量肯定比现在求小,因为现在要求个向量,而最后只需要求个)。

  1. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前行组成矩阵

6.这里就是对特征值做从大到小的排序,可以用np.sorted()函数排序。

7.然后根据排序取前行的向量组成一个新的矩阵。

相关推荐
科技小花1 小时前
全球化深水区,数据治理成为企业出海 “核心竞争力”
大数据·数据库·人工智能·数据治理·数据中台·全球化
zhuiyisuifeng2 小时前
2026前瞻:GPTimage2镜像官网或将颠覆视觉创作
人工智能·gpt
徐健峰2 小时前
GPT-image-2 热门玩法实战(一):AI 看手相 — 一张手掌照片生成专业手相分析图
人工智能·gpt
weixin_370976352 小时前
AI的终极赛跑:进入AGI,还是泡沫破灭?
大数据·人工智能·agi
Slow菜鸟2 小时前
AI学习篇(五) | awesome-design-md 使用说明
人工智能·学习
超级码力6662 小时前
【Latex文件架构】Latex文件架构模板
算法·数学建模·信息可视化
穿条秋裤到处跑3 小时前
每日一道leetcode(2026.04.29):二维网格图中探测环
算法·leetcode·职场和发展
冬奇Lab3 小时前
RAG 系列(五):Embedding 模型——语义理解的核心
人工智能·llm·aigc
深小乐3 小时前
AI 周刊【2026.04.27-05.03】:Anthropic 9000亿美元估值、英伟达死磕智能体、中央重磅定调AI
人工智能
码点滴3 小时前
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?
人工智能·gpt·架构·大模型·deepseek