数据可视化02-PCA降维

一、PCA

**PCA做什么?**找坐标系。

**目标?**二维降到一维,信息保留最多。

**怎么样最好?**数据分布最分散的方向(方差最大),作为主成分(坐标轴)。

二、怎么找主成分?

PC1的确定: 每个点的 之和最小, 之和最大。

**PC2的确定:**过原点,且与PC1垂直。

**PCA降维的核心思想是:**用少数几个最重要的方向(主成分PC1)来表示数据,而不是用所有方向。

为什么可以降噪?

  1. 舍弃次要方向: 噪声(偏离的点)通常分布在次要方向(如PC2)上,降维时舍弃这些方向,相当于过滤了一部分噪声。

  2. 压缩噪声的影响: 即使噪声点在PC1上仍有偏离,它们的偏离程度比在原始数据中要小。

三、特征值与特征向量

(一)特征向量

简单来说,特征向量定义了新的坐标轴的方向

(二)特征值

特征值表示了每个主成分在数据集中的方差贡献率

(三)碎石图

相关推荐
小鸡吃米…22 分钟前
机器学习 - K - 中心聚类
人工智能·机器学习·聚类
好奇龙猫1 小时前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
沈浩(种子思维作者)1 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan1 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维1 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS1 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd2 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
njsgcs2 小时前
ue python二次开发启动教程+ 导入fbx到指定文件夹
开发语言·python·unreal engine·ue
io_T_T2 小时前
迭代器 iteration、iter 与 多线程 concurrent 交叉实践(详细)
python
水如烟2 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能