2.4特征预处理(机器学习)

2.4特征预处理

2.4.1 什么是特征预处理

通过

一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

1 包含内容

数值型数据的无量纲化:

归一化

标准化

2 特征预处理API

sklearn.preprocessing

为什么要进行归一化/标准化?

特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要打出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其他的特征。

我们需要用到一些方法进行无量纲化,使不同规格的数据转换到统一规格。

归一化/标准化(数学上叫做;无量纲化)

2.4.2 归一化

1 定义

通过对原始数据进行变换把数据映射到(默认为【0,1】之间。

2 公式

举例:

3 API

pycharm:

2.4.3 标准化

1 定义

通过对原始数据进行变形把数据变换到均值为0,标准差为1范围内。

2 公式

标准差:集中程度

对于归一化;如果出现异常点,影响了最大值和最小值,那么结果显然会发生改变。

对于标准化,如果出现异常点,由于具有一定数据量,shaom两点异常点对于平均值的影响并不大,从而方差改变较小。

3 API

相关推荐
程序员勋勋1几秒前
使用claude code时,为什么token消费会突然一下变高
人工智能
五点钟科技6 分钟前
LLaVA 论文精读以及源码网络结构完整分析
人工智能·多模态·clip·llava
Gofarlic_OMS18 分钟前
应对MathWorks合规审查的专项准备工作
大数据·服务器·网络·数据库·人工智能
-cywen-19 分钟前
VAE(Variational AutoEncoder)
人工智能·深度学习
05大叔25 分钟前
词向量化和文本向量化,KMeans
人工智能·机器学习
云空28 分钟前
《Hermes Agent 部署与使用中的安全漏洞分析及解决办法》
网络·人工智能·安全
柯西劝我别收敛39 分钟前
[AI-INFRA] HAMI VGPU 系列01:HAMI-Webhook
人工智能
实在智能RPA44 分钟前
Agent能适配不同行业的合规要求吗?——2026年企业级AI Agent合规技术架构与落地全解析
人工智能·ai·架构
柯西劝我别收敛1 小时前
[AI-INFRA] HAMI VGPU 系列02:HAMI-Device-Plugin
人工智能
lizz6661 小时前
Hermes-Agent 新手安装指南(言简意赅版)
人工智能·ai