Python数据分析与可视化笔记 六 特征构建 特征提取 主成分分析 独立成分分析 线性判别分析

特征构建

特征构建是指从原始特征中人工构建新的特征。假设原始数据是表格数据,可以使用混合属性或者组合数学来创建新的特征。

特征提取

特征提取是在原始特征的基础上,自动构建新的特征,将原始数据转换为一组更具物理意义、统计意义或者核的特征。特征提取的主要方法包括主成分分析、独立成分分析和线性判别分析。

1.主成分分析 (Principal Component Analysis, PCA)

PCA的思想是通过坐标轴转换 ,寻找数据分布的最优子空间,从而达到降维去除数据间相关性的目的。在数学上,是先用原始数据协方差矩阵的前 N 个最大特征值对应的特征向量构成映射矩阵,然后原始矩阵左乘映射矩阵,从而对原始数据降维。

2.独立成分分析(Independent Component Analysis, ICA)

PCA特征转换降维,提取的是不相关的部分, ICA 获得的是相互独立的属性 。ICA 算法本质是寻找一个线性变换 Z = W_x,使得 Z 的各特征分量之间的独立性最大。ICA 比 PCA更能刻画变量的随机统计特性 ,且能抑制噪声。ICA 认为观测到的数据矩阵 X 是可以由未知的独立元矩阵 S 与未知的矩阵 A 相乘得到的。

3.线性判别分析( Linear Discriminant Analysis,LDA)

LDA 的原理是将带上标签的数据(点)通过投影的方法,投影到维度更低的空间,使得投影后的点会形成按类别区分,相同类别的点将会在投影后更接近。

相关推荐
IT_陈寒1 小时前
Python开发者必知的5大性能陷阱:90%的人都踩过的坑!
前端·人工智能·后端
1G2 小时前
openclaw控制浏览器/自动化的playwright MCP + Mcporter方案实现
人工智能
踩着两条虫2 小时前
VTJ.PRO 双向代码转换原理揭秘
前端·vue.js·人工智能
扉川川2 小时前
OpenClaw 架构解析:一个生产级 AI Agent 是如何设计的
前端·人工智能
星浩AI2 小时前
让模型自己写 Skills——从素材到自动生成工作流
人工智能·后端·agent
千寻girling6 小时前
Python 是用来做 AI 人工智能 的 , 不适合开发 Web 网站 | 《Web框架》
人工智能·后端·算法
AI攻城狮6 小时前
OpenClaw 里 TAVILY_API_KEY 明明写在 ~/.bashrc,为什么还是失效?一次完整排查与修复
人工智能·云原生·aigc
stark张宇6 小时前
构建第一个AI聊天机器人:Flask+DeepSeek+Postgres实战
人工智能·postgresql·flask
yiyu07168 小时前
3分钟搞懂深度学习AI:自我进化的最简五步法
人工智能·深度学习
浪浪山_大橙子10 小时前
OpenClaw 十分钟快速,安装与接入完全指南 - 推荐使用trae 官方 skills 安装
前端·人工智能