2.4特征预处理(机器学习)

2.4特征预处理

2.4.1 什么是特征预处理

通过

一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

1 包含内容

数值型数据的无量纲化:

归一化

标准化

2 特征预处理API

sklearn.preprocessing

为什么要进行归一化/标准化?

特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要打出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其他的特征。

我们需要用到一些方法进行无量纲化,使不同规格的数据转换到统一规格。

归一化/标准化(数学上叫做;无量纲化)

2.4.2 归一化

1 定义

通过对原始数据进行变换把数据映射到(默认为【0,1】之间。

2 公式

举例:

3 API

pycharm:

2.4.3 标准化

1 定义

通过对原始数据进行变形把数据变换到均值为0,标准差为1范围内。

2 公式

标准差:集中程度

对于归一化;如果出现异常点,影响了最大值和最小值,那么结果显然会发生改变。

对于标准化,如果出现异常点,由于具有一定数据量,shaom两点异常点对于平均值的影响并不大,从而方差改变较小。

3 API

相关推荐
sz66cm4 分钟前
数学基础 -- 拉普拉斯算子的原理与应用
深度学习·机器学习·计算机视觉·数学基础
Jeo_dmy5 分钟前
ChatGPT入门之文本情绪识别:先了解LSTM如何处理文字序列
人工智能·chatgpt·lstm
JINGWHALE111 分钟前
设计模式 行为型 状态模式(State Pattern)与 常见技术框架应用 解析
前端·人工智能·后端·设计模式·性能优化·系统架构·状态模式
飞飞是甜咖啡1 小时前
【Orca】Orca - Graphlet 和 Orbit 计数算法
c语言·c++·人工智能·python
mqiqe1 小时前
Spring AI ChatClient
人工智能·spring·microsoft
Schwertlilien1 小时前
模式识别-Ch3-贝叶斯估计
人工智能·机器学习·概率论
长风清留扬1 小时前
小程序在智慧城市构建中的角色与功能研究
javascript·css·人工智能·微信小程序·小程序·html·智慧城市
xiaocang6688881 小时前
深度学习:原理、应用与前沿进展
人工智能·深度学习·机器学习
ClonBrowser2 小时前
Facebook 隐私变革之路:回顾与展望
人工智能·数据安全·facebook·隐私保护
EDPJ2 小时前
(2025,Cosmos,世界基础模型 (WFM) 平台,物理 AI,数据处理,分词器,世界基础模型预训练/后训练,3D一致性)
人工智能·深度学习·视觉语言模型