机器学习-无监督算法之降维

  • 降维:将训练数据中的样本从高维空间转换到低维空间,降维是对原始数据线性变换实现的。
  • 为什么要降维?高维计算难,泛化能力差,防止维数灾难
  • 优点:减少冗余特征,方便数据可视化,减少内存。
  • 缺点:可能丢失数据,需要确定保留多少主成分

奇异值分解

  • 把一个矩阵拆成三个,对角矩阵起到拉伸作用,正交矩阵起到旋转作用。
  • A = UΣVT:U和V为正交矩阵,Σ为对角矩阵

Created with Raphaël 2.3.0 开始 M = UΣV^T 求M^TM的特征向量得到V 求MM^T的特征向量得到U 求M^TM或MM^T的特征值,然后开放得到奇异值 构成对角矩阵Σ

  • 应用:节省存储空间,降维,图片压缩

主成分分析

  1. PCA识别在训练集中占方差最大的轴
  2. 步骤
  • Z值化
  • 计算协方差矩阵,它的特征向量就是主成分
    • 利用SVD求特征向量
    • 基于特征值求特征向量
  1. 对角矩阵代表方差,其余代表相关性
  2. 缺点:分类问题效果不好

t-SNE

  1. 归一化
  2. 计算在二维空间中数据的相似度
  3. 将二维随机映射到一维,然后按照高纬度和低纬度相似度的差异,设计损失函数,用梯度下降来优化


常见降维算法

相关推荐
qq_4042658314 小时前
C++中的代理模式实战
开发语言·c++·算法
xinxiangwangzhi_14 小时前
RAFT光流论文总结
人工智能·计算机视觉
Smoothcloud润云14 小时前
告别 Selenium:Playwright 现代 Web 自动化测试从入门到实战
前端·人工智能·selenium·测试工具·架构·自动化
Lab_AI14 小时前
AI4S在药物发现上的应用 :基于配体和结构发现靶向微观蛋白秋水碱部位的潜在小分子
人工智能·药物设计·ais·aidd·药物发现·药物筛选·靶点药物设计
song85460113414 小时前
AI 大模型到IDE/插件的使用
ide·人工智能
TEC_INO14 小时前
Linux45:RV1126+OPENCV对视频流进行视频腐蚀操作
人工智能·opencv·音视频
玛卡巴卡ldf14 小时前
【LeetCode 手撕算法】(滑动窗口) 3-无重复字符的最长子串、438-找到字符串中所有字母异位词
数据结构·算法·leetcode·哈希算法
1941s14 小时前
05-Agent 智能体开发实战指南(五):中间件系统与动态提示词
人工智能·python·中间件·langchain
zhangshuang-peta14 小时前
MCP 中的“人机协同”:通过监督与政策保障自主人工智能的安全
人工智能·安全·ai agent·mcp·peta
liuyao_xianhui14 小时前
动态规划_最大子数组和_C++
java·开发语言·数据结构·c++·算法·链表·动态规划