2.4特征预处理(机器学习)

2.4特征预处理

2.4.1 什么是特征预处理

通过

一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

1 包含内容

数值型数据的无量纲化:

归一化

标准化

2 特征预处理API

sklearn.preprocessing

为什么要进行归一化/标准化?

特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要打出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其他的特征。

我们需要用到一些方法进行无量纲化,使不同规格的数据转换到统一规格。

归一化/标准化(数学上叫做;无量纲化)

2.4.2 归一化

1 定义

通过对原始数据进行变换把数据映射到(默认为【0,1】之间。

2 公式

举例:

3 API

pycharm:

2.4.3 标准化

1 定义

通过对原始数据进行变形把数据变换到均值为0,标准差为1范围内。

2 公式

标准差:集中程度

对于归一化;如果出现异常点,影响了最大值和最小值,那么结果显然会发生改变。

对于标准化,如果出现异常点,由于具有一定数据量,shaom两点异常点对于平均值的影响并不大,从而方差改变较小。

3 API

相关推荐
Takoony16 分钟前
深度学习多卡训练必须使用偶数张GPU吗?原理深度解析
人工智能·深度学习
翱翔的苍鹰20 分钟前
通俗、生动的方式 来讲解“卷积神经网络(CNN)
人工智能·神经网络·cnn
Irene.ll21 分钟前
DAY31 文件的拆分方法和规范
人工智能·机器学习
真上帝的左手22 分钟前
26. AI-大语言模型应用发展
人工智能
Coder_Boy_27 分钟前
基于SpringAI的在线考试系统-阅卷评分模块时序图
java·人工智能·spring boot
小快说网安33 分钟前
AI 短剧平台的 “保命符”:高防 IP 如何抵御流量攻击与业务中断风险
人工智能·网络协议·tcp/ip
Cigaretter742 分钟前
Day 51 神经网络调参指南
人工智能·深度学习·神经网络
安特尼1 小时前
推荐算法手撕集合(持续更新)
人工智能·算法·机器学习·推荐算法
Lun3866buzha1 小时前
【数学表达式识别】基于计算机视觉技术的数学符号与数字识别系统实现_1
人工智能·计算机视觉
橘子师兄1 小时前
C++AI大模型接入SDK—环境搭建
开发语言·c++·人工智能