机器学习课程复习——主成分分析

Q:主成分分析的步骤?

1.数据预处理:对给定数据进行规范化(中心化处理),使得每一变量的平均值为0,方差为1

2.对数据进行正交变换:

原来由线性相关变量表示的数据通过正交变换变成由若干个线性无关的新变量表示的数据,新变量是可能的正交变换中变量的方差的和最大的,方差表示在新变量上信息的大小

(1)计算协方差矩阵:协方差矩阵描述了不同特征之间的相互关系

(2)求解特征值和特征向量:特征值表示对应特征向量方向上的方差大小,特征向量则定义了新的坐标轴方向

(3)选择主成分:根据特征值的大小选择前k个最大的特征值对应的特征向量作为主成分

(4)数据降维:将原始数据投影到选定的主成分构成的新坐标系中,得到降维后的数据

3.找到数据分布最分散的方向(方差最大) 作为主成分(坐标轴)

Q:主成分分析需要调的参数?

  1. n_components: 该参数决定PCA算法保留的主成分个数,即降维后的数据维度。可以直接设置为一个整数,表示希望保留的维度数;也可以设置为0到1之间的小数,表示保留的主成分方差百分比;还可以设置为'mle',此时PCA会自动选择足够多的主成分以保持指定的方差百分比。
  2. copy: 该参数决定是否在运行PCA算法之前复制输入数据。如果设为True,则会复制数据,这样原始数据不会被修改;如果设为False,则直接在原始数据上进行计算,这可能会改变原始数据的内容。
  3. whiten: 该参数决定是否对降维后的数据进行白化处理。白化处理会使所有特征均值为0方差为1。
  4. svd_solver: 该参数用于指定奇异值分解(SVD)的方法。不同的求解器适用于不同大小和结构的数据集,例如'randomized'适用于大规模数据集,而'full'则适用于较小规模的数据集。
相关推荐
带娃的IT创业者2 分钟前
意识的奥秘:从哲学思辨到工程实践
人工智能·神经网络·脑机接口·ai智能体·深度学习应用·nct·人工智能框架
忙碌5444 分钟前
2026年大语言模型微调实战:从零到一构建专属AI助手
人工智能·深度学习
组合缺一4 分钟前
赋予 AI 灵魂:如何在 Java AI 生态实现一个会“自我反思”的长期记忆系统
java·人工智能·ai·llm·agent·solon·mcp
向哆哆10 分钟前
厨房食品卫生安全检测数据集:智能餐饮与食品安全保障的视觉卫士
人工智能·安全·目标跟踪
大模型任我行10 分钟前
谷歌:预训练到微调的知识迁移规律
人工智能·语言模型·自然语言处理·论文笔记
悠闲蜗牛�12 分钟前
高并发大模型推理优化实战:从模型压缩到服务化部署
人工智能
菜鸟小芯12 分钟前
【GLM-5 陪练式前端新手入门】第四篇:卡片布局 —— 让个人主页内容更有层次
前端·人工智能
AI周红伟21 分钟前
大模型部署入门教程,消费级显卡跑通Qwen3.5-Plus,最低配置部署教程,不能在简单了
大数据·人工智能·大模型·智能体
阿_旭23 分钟前
【视觉AI赋能智慧农业】三大应用场景、简化农作流程、核心价值全解析
人工智能·智慧农业
沃达德软件24 分钟前
视频监控数据分析服务
图像处理·人工智能·深度学习·目标检测·计算机视觉·数据挖掘·数据分析