2.5 特征降维(机器学习)

2.5 特征降维

2.5.1 降维

降维:是指在某些限定条件下,降低随机变量(特征)个数,得到一组"不相关"主变量的过程。

ndarray

维数 嵌套的层数

0维 标量

1维 向量

2维 矩阵

3维

n维

二维数组

降低的维度是降低特征的个数。

效果:

特征与特征之间不相关

2.5.2 降维的两种方式

特征选择

主成分分析(可以理解一种特征提取的方式)

2.5.3 什么是特征选择

1 定义

数据中包含冗余或相关变量(或称特征,属性,指标等),旨在从原有特征中找出主要特征。

2 方法

相关系数:特征与特征之间的相关程度。

3 模块

sklearn.feature_selection

4 过滤式

4.1 低方差特征过滤
4.2 相关系数

皮尔逊相关系数:反应变量之间相关关系密切程度的统计指标。

经计算相关系数=0.9942.

所以我们得出结论是广告投入费与月平均销售额之间有高度的正相关关系。

特点
API

特征与特征相关性很高:(采取措施)

1)选取其中一个

2)按一定权重进行加权,在进行加权求和。

3)主成分分析

相关推荐
兮℡檬,2 分钟前
房价预测|Pytorch
人工智能·pytorch·python
青春不败 177-3266-05201 小时前
MATLAB近红外光谱分析技术及实践技术应用
随机森林·机器学习·支持向量机·matlab·卷积神经网络·遗传算法·近红外光谱
不知天地为何吴女士2 小时前
Day32| 509. 斐波那契数、70. 爬楼梯、746. 使用最小花费爬楼梯
算法
小坏坏的大世界2 小时前
C++ STL常用容器总结(vector, deque, list, map, set)
c++·算法
励志要当大牛的小白菜4 小时前
ART配对软件使用
开发语言·c++·qt·算法
qq_513970445 小时前
力扣 hot100 Day56
算法·leetcode
白-胖-子5 小时前
深入剖析大模型在文本生成式 AI 产品架构中的核心地位
人工智能·架构
PAK向日葵5 小时前
【算法导论】如何攻克一道Hard难度的LeetCode题?以「寻找两个正序数组的中位数」为例
c++·算法·面试
想要成为计算机高手6 小时前
11. isaacsim4.2教程-Transform 树与Odometry
人工智能·机器人·自动驾驶·ros·rviz·isaac sim·仿真环境
NeoFii7 小时前
Day 22: 复习
机器学习