2.4特征预处理(机器学习)

2.4特征预处理

2.4.1 什么是特征预处理

通过

一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

1 包含内容

数值型数据的无量纲化:

归一化

标准化

2 特征预处理API

sklearn.preprocessing

为什么要进行归一化/标准化?

特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要打出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其他的特征。

我们需要用到一些方法进行无量纲化,使不同规格的数据转换到统一规格。

归一化/标准化(数学上叫做;无量纲化)

2.4.2 归一化

1 定义

通过对原始数据进行变换把数据映射到(默认为【0,1】之间。

2 公式

举例:

3 API

pycharm:

2.4.3 标准化

1 定义

通过对原始数据进行变形把数据变换到均值为0,标准差为1范围内。

2 公式

标准差:集中程度

对于归一化;如果出现异常点,影响了最大值和最小值,那么结果显然会发生改变。

对于标准化,如果出现异常点,由于具有一定数据量,shaom两点异常点对于平均值的影响并不大,从而方差改变较小。

3 API

相关推荐
张子夜 iiii21 分钟前
(0️⃣基础)程序控制语句(初学者)(第3天)
人工智能·python
xiaoxiaoxiaolll22 分钟前
双驱智造革命:物理方程+工业数据训练,突破增材制造温度场预测瓶颈
人工智能·深度学习·学习·制造
CareyWYR1 小时前
高效智能体设计:如何在不牺牲效果的前提下降低成本?
人工智能
Sui_Network2 小时前
Walrus 与 Pipe Network 集成,提升多链带宽并降低延迟
人工智能·web3·区块链·智能合约·量子计算
攻城狮7号3 小时前
GPT-OSS重磅开源:当OpenAI重拾“开放”初心
人工智能·openai·开源大模型·gpt-oss
我不是小upper3 小时前
什么是键值缓存?让 LLM 闪电般快速
人工智能·缓存·llm
2zcode3 小时前
基于Matlab图像处理的黄豆自动计数系统设计与实现
图像处理·人工智能·matlab
金智维科技官方3 小时前
常见的大模型分类
人工智能·算法·ai·语言模型·数据挖掘
TY-20253 小时前
五、CV_ResNet
人工智能