2.5 特征降维(机器学习)

2.5 特征降维

2.5.1 降维

降维:是指在某些限定条件下,降低随机变量(特征)个数,得到一组"不相关"主变量的过程。

ndarray

维数 嵌套的层数

0维 标量

1维 向量

2维 矩阵

3维

n维

二维数组

降低的维度是降低特征的个数。

效果:

特征与特征之间不相关

2.5.2 降维的两种方式

特征选择

主成分分析(可以理解一种特征提取的方式)

2.5.3 什么是特征选择

1 定义

数据中包含冗余或相关变量(或称特征,属性,指标等),旨在从原有特征中找出主要特征。

2 方法

相关系数:特征与特征之间的相关程度。

3 模块

sklearn.feature_selection

4 过滤式

4.1 低方差特征过滤
4.2 相关系数

皮尔逊相关系数:反应变量之间相关关系密切程度的统计指标。

经计算相关系数=0.9942.

所以我们得出结论是广告投入费与月平均销售额之间有高度的正相关关系。

特点
API

特征与特征相关性很高:(采取措施)

1)选取其中一个

2)按一定权重进行加权,在进行加权求和。

3)主成分分析

相关推荐
wuweijianlove1 小时前
算法性能的渐近与非渐近行为对比的技术4
算法
墨染天姬1 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
_dindong1 小时前
cf1091div2 C.Grid Covering(数论)
c++·算法
AI成长日志1 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114241 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠1 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光2 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
skywalker_112 小时前
力扣hot100-3(最长连续序列),4(移动零)
数据结构·算法·leetcode
6Hzlia2 小时前
【Hot 100 刷题计划】 LeetCode 17. 电话号码的字母组合 | C++ 回溯算法经典模板
c++·算法·leetcode
小超同学你好2 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型