2.5 特征降维(机器学习)

2.5 特征降维

2.5.1 降维

降维:是指在某些限定条件下,降低随机变量(特征)个数,得到一组"不相关"主变量的过程。

ndarray

维数 嵌套的层数

0维 标量

1维 向量

2维 矩阵

3维

n维

二维数组

降低的维度是降低特征的个数。

效果:

特征与特征之间不相关

2.5.2 降维的两种方式

特征选择

主成分分析(可以理解一种特征提取的方式)

2.5.3 什么是特征选择

1 定义

数据中包含冗余或相关变量(或称特征,属性,指标等),旨在从原有特征中找出主要特征。

2 方法

相关系数:特征与特征之间的相关程度。

3 模块

sklearn.feature_selection

4 过滤式

4.1 低方差特征过滤
4.2 相关系数

皮尔逊相关系数:反应变量之间相关关系密切程度的统计指标。

经计算相关系数=0.9942.

所以我们得出结论是广告投入费与月平均销售额之间有高度的正相关关系。

特点
API

特征与特征相关性很高:(采取措施)

1)选取其中一个

2)按一定权重进行加权,在进行加权求和。

3)主成分分析

相关推荐
Godspeed Zhao3 分钟前
自动驾驶中的传感器技术42——Radar(3)
人工智能·机器学习·自动驾驶
Godspeed Zhao4 分钟前
自动驾驶中的传感器技术41——Radar(2)
人工智能·机器学习·自动驾驶
索迪迈科技1 小时前
Flink Task线程处理模型:Mailbox
java·大数据·开发语言·数据结构·算法·flink
非门由也1 小时前
《sklearn机器学习——数据预处理》类别特征编码
人工智能·机器学习·sklearn
FairyGirlhub2 小时前
神经网络的初始化:权重与偏置的数学策略
人工智能·深度学习·神经网络
元亓亓亓2 小时前
LeetCode热题100--230. 二叉搜索树中第 K 小的元素--中等
算法·leetcode·职场和发展
草莓熊Lotso2 小时前
《算法闯关指南:优选算法-双指针》--01移动零,02复写零
c语言·c++·经验分享·算法·leetcode
焜昱错眩..3 小时前
代码随想录算法训练营第三十九天|62.不同路径 63.不同路径ll
算法
大写-凌祁6 小时前
零基础入门深度学习:从理论到实战,GitHub+开源资源全指南(2025最新版)
人工智能·深度学习·开源·github
焦耳加热7 小时前
阿德莱德大学Nat. Commun.:盐模板策略实现废弃塑料到单原子催化剂的高值转化,推动环境与能源催化应用
人工智能·算法·机器学习·能源·材料工程