2.4特征预处理(机器学习)

2.4特征预处理

2.4.1 什么是特征预处理

通过

一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

1 包含内容

数值型数据的无量纲化:

归一化

标准化

2 特征预处理API

sklearn.preprocessing

为什么要进行归一化/标准化?

特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要打出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其他的特征。

我们需要用到一些方法进行无量纲化,使不同规格的数据转换到统一规格。

归一化/标准化(数学上叫做;无量纲化)

2.4.2 归一化

1 定义

通过对原始数据进行变换把数据映射到(默认为【0,1】之间。

2 公式

举例:

3 API

pycharm:

2.4.3 标准化

1 定义

通过对原始数据进行变形把数据变换到均值为0,标准差为1范围内。

2 公式

标准差:集中程度

对于归一化;如果出现异常点,影响了最大值和最小值,那么结果显然会发生改变。

对于标准化,如果出现异常点,由于具有一定数据量,shaom两点异常点对于平均值的影响并不大,从而方差改变较小。

3 API

相关推荐
Donvink25 分钟前
Transformers在计算机视觉领域中的应用【第3篇:Swin Transformer——多层次的Vision Transformer】
人工智能·深度学习·目标检测·计算机视觉·transformer
龙的爹233331 分钟前
2024论文翻译 | Multi-Review Fusion-in-Context
人工智能·深度学习·自然语言处理·prompt
梁小憨憨44 分钟前
变分推断(Variational Inference)
人工智能·算法·机器学习
资讯分享周1 小时前
思特奇亮相2024数字科技生态大会,以“智”谋新共赢AI新时代
人工智能·科技
HuggingAI1 小时前
Stable Diffusion Controlnet常用控制类型解析与实战课程 2
人工智能·ai·stable diffusion·ai绘画
一尘之中2 小时前
基于Transformer的编码器-解码器图像描述模型在AMD GPU上的应用
人工智能·深度学习·transformer
IT古董2 小时前
【机器学习】机器学习的基本分类-监督学习-决策树-C4.5 算法
人工智能·学习·算法·决策树·机器学习·分类
IT古董2 小时前
【机器学习】机器学习的基本分类-监督学习-决策树-CART(Classification and Regression Tree)
学习·决策树·机器学习·分类
电子工程师UP学堂2 小时前
电子应用设计方案-37:智能鼠标系统方案设计
人工智能·单片机·嵌入式硬件·计算机外设
后端研发Marion2 小时前
【AI工具】强大的AI编辑器Cursor详细使用教程
人工智能·编辑器·cusor