2.5 特征降维(机器学习)

2.5 特征降维

2.5.1 降维

降维:是指在某些限定条件下,降低随机变量(特征)个数,得到一组"不相关"主变量的过程。

ndarray

维数 嵌套的层数

0维 标量

1维 向量

2维 矩阵

3维

n维

二维数组

降低的维度是降低特征的个数。

效果:

特征与特征之间不相关

2.5.2 降维的两种方式

特征选择

主成分分析(可以理解一种特征提取的方式)

2.5.3 什么是特征选择

1 定义

数据中包含冗余或相关变量(或称特征,属性,指标等),旨在从原有特征中找出主要特征。

2 方法

相关系数:特征与特征之间的相关程度。

3 模块

sklearn.feature_selection

4 过滤式

4.1 低方差特征过滤
4.2 相关系数

皮尔逊相关系数:反应变量之间相关关系密切程度的统计指标。

经计算相关系数=0.9942.

所以我们得出结论是广告投入费与月平均销售额之间有高度的正相关关系。

特点
API

特征与特征相关性很高:(采取措施)

1)选取其中一个

2)按一定权重进行加权,在进行加权求和。

3)主成分分析

相关推荐
AC赳赳老秦1 分钟前
DeepSeek 辅助科研项目申报:可行性报告与经费预算框架的智能化撰写指南
数据库·人工智能·科技·mongodb·ui·rabbitmq·deepseek
瑞华丽PLM9 分钟前
国产PLM软件源头厂家的AI技术应用与智能化升级
人工智能·plm·国产plm·瑞华丽plm·瑞华丽
Ryan老房14 分钟前
无人机航拍图像标注-从采集到训练全流程
yolo·目标检测·机器学习·计算机视觉·目标跟踪·无人机
你撅嘴真丑17 分钟前
第八章 - 贪心法
开发语言·c++·算法
xixixi7777718 分钟前
基于零信任架构的通信
大数据·人工智能·架构·零信任·通信·个人隐私
玄同76521 分钟前
LangChain v1.0+ Prompt 模板完全指南:构建精准可控的大模型交互
人工智能·语言模型·自然语言处理·langchain·nlp·交互·知识图谱
VT.馒头22 分钟前
【力扣】2625. 扁平化嵌套数组
前端·javascript·算法·leetcode·职场和发展·typescript
wanghu202423 分钟前
AT_abc443_C~E题题解
c语言·算法
Ryan老房25 分钟前
开源vs商业-数据标注工具的选择困境
人工智能·yolo·目标检测·计算机视觉·ai
取个鸣字真的难30 分钟前
Obsidian + CC:用AI 打造知识管理系统
人工智能·产品运营