2.5 特征降维(机器学习)

2.5 特征降维

2.5.1 降维

降维:是指在某些限定条件下,降低随机变量(特征)个数,得到一组"不相关"主变量的过程。

ndarray

维数 嵌套的层数

0维 标量

1维 向量

2维 矩阵

3维

n维

二维数组

降低的维度是降低特征的个数。

效果:

特征与特征之间不相关

2.5.2 降维的两种方式

特征选择

主成分分析(可以理解一种特征提取的方式)

2.5.3 什么是特征选择

1 定义

数据中包含冗余或相关变量(或称特征,属性,指标等),旨在从原有特征中找出主要特征。

2 方法

相关系数:特征与特征之间的相关程度。

3 模块

sklearn.feature_selection

4 过滤式

4.1 低方差特征过滤
4.2 相关系数

皮尔逊相关系数:反应变量之间相关关系密切程度的统计指标。

经计算相关系数=0.9942.

所以我们得出结论是广告投入费与月平均销售额之间有高度的正相关关系。

特点
API

特征与特征相关性很高:(采取措施)

1)选取其中一个

2)按一定权重进行加权,在进行加权求和。

3)主成分分析

相关推荐
小白程序员成长日记2 分钟前
力扣每日一题 2025.11.30
数据结构·算法·leetcode
崎岖Qiu3 分钟前
二叉树的非递归后序遍历-双栈法
算法·二叉树·力扣·深度优先遍历·
哈哈哈也不行吗5 分钟前
从入门到精通:大角几何在教学中的深度应用
人工智能·几何画板·几何绘图·大角几何·数学绘图工具
也不知秋6 分钟前
巧用 AI 提升 Excel 工作效率
人工智能
竹杖芒鞋轻胜马,夏天喜欢吃西瓜7 分钟前
哈希算法解析
算法·哈希算法
执笔论英雄15 分钟前
【RL】 ROLL中负载均衡
运维·算法·负载均衡
szxinmai主板定制专家17 分钟前
基于x86和ARM的EtherCAT运动控制器,最大支持32轴,支持codesys和实时系统优化
arm开发·人工智能·嵌入式硬件·yolo
星辞树19 分钟前
从计数到预测:深入浅出词向量 (Word Vectors) —— Stanford CS224n 作业实战记录
算法
JarryStudy20 分钟前
自动调优在Triton-on-Ascend中的应用:从参数优化到性能极致挖掘
人工智能·算法·昇腾·cann·ascend c
CoderYanger24 分钟前
递归、搜索与回溯-穷举vs暴搜vs深搜vs回溯vs剪枝:13.子集
java·算法·leetcode·机器学习·剪枝·1024程序员节