数据可视化02-PCA降维

一、PCA

**PCA做什么?**找坐标系。

**目标?**二维降到一维,信息保留最多。

**怎么样最好?**数据分布最分散的方向(方差最大),作为主成分(坐标轴)。

二、怎么找主成分?

PC1的确定: 每个点的 之和最小, 之和最大。

**PC2的确定:**过原点,且与PC1垂直。

**PCA降维的核心思想是:**用少数几个最重要的方向(主成分PC1)来表示数据,而不是用所有方向。

为什么可以降噪?

  1. 舍弃次要方向: 噪声(偏离的点)通常分布在次要方向(如PC2)上,降维时舍弃这些方向,相当于过滤了一部分噪声。

  2. 压缩噪声的影响: 即使噪声点在PC1上仍有偏离,它们的偏离程度比在原始数据中要小。

三、特征值与特征向量

(一)特征向量

简单来说,特征向量定义了新的坐标轴的方向

(二)特征值

特征值表示了每个主成分在数据集中的方差贡献率

(三)碎石图

相关推荐
GISer_Jing几秒前
AI全栈转型_TS后端学习路线
前端·人工智能·后端·学习
漫游的渔夫几秒前
前端开发者做 Agent:别只会执行,用 4 类失败策略让 AI 知道怎么停
前端·人工智能·typescript
娃娃略2 分钟前
Frame
人工智能·深度学习·机器学习
Python私教6 分钟前
Pure-Admin-Thin 深度解析:完整版和精简版到底怎么选?
vue.js·人工智能·开源
星马梦缘9 分钟前
强化学习实战8.3——用PPO打赢星际争霸【编写自定义环境GYM】
人工智能·强化学习·gymnasium·星际争霸·sc2·starcraft2·sb3
翔云1234569 分钟前
大模型部署全流程深度解析
人工智能·ai·大模型
BU摆烂会噶10 分钟前
【LangGraph】持久化实现的三大能力——人机交互
数据库·人工智能·python·langchain·人机交互
沐风老师11 分钟前
开发AI机器人操作系统用什么编程语言?
人工智能·ai编程·机器人操作系统
念威12 分钟前
弹幕互动游戏AI无人直播方案 - 可遇AI无人直播助手
人工智能·游戏
BizViewStudio13 分钟前
甄选方法:2026 企业新媒体代运营的短视频精细化运营与流量转化技巧
大数据·网络·人工智能·媒体