机器学习和数据挖掘04-PowerTransformer与 MinMaxScaler

概念 PowerTransformer(幂变换器)

PowerTransformer 是用于对数据进行幂变换(也称为Box-Cox变换)的预处理工具。幂变换可以使数据更接近正态分布,这有助于某些机器学习算法的性能提升。它支持两种常用的幂变换:Yeo-Johnson变换和Box-Cox变换。

代码实现

python 复制代码
from sklearn.preprocessing import PowerTransformer
import numpy as np

data = np.array([[1.0], [2.0], [3.0], [4.0], [5.0]])

transformer = PowerTransformer(method='yeo-johnson')
transformed_data = transformer.fit_transform(data)

print("Original Data:\n", data)
print("Transformed Data:\n", transformed_data)

概念MinMaxScaler(最小-最大缩放器)

MinMaxScaler 是用于将数据进行最小-最大缩放的预处理工具。它将数据缩放到指定的范围,通常是

0,到。这对于那些受到特征尺度影响的算法(如K近邻和支持向量机)非常有用。

代码实现

python 复制代码
from sklearn.preprocessing import MinMaxScaler
import numpy as np

data = np.array([[1.0], [2.0], [3.0], [4.0], [5.0]])

scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(data)

print("Original Data:\n", data)
print("Scaled Data:\n", scaled_data)
相关推荐
大筒木老辈子19 分钟前
Linux笔记---封装套接字
笔记
江畔独步42 分钟前
Flink TaskManager日志时间与实际时间有偏差
大数据·flink
AlexMercer10121 小时前
[前端]1.html基础
前端·笔记·学习·html
楚肽生物小敏1 小时前
Cy3-Tyramide,Cyanine 3 Tyramide; 174961-75-2
笔记
TDengine (老段)1 小时前
TDengine 选择函数 Last() 用户手册
大数据·数据库·sql·物联网·时序数据库·tdengine·涛思数据
TDengine (老段)2 小时前
TDengine 选择函数 First 用户手册
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
健康平安的活着2 小时前
langchain4j笔记篇(阳哥)
笔记
一川月白7092 小时前
51单片机---硬件学习(跑马灯、数码管、外部中断、按键、蜂鸣器)
单片机·学习·51单片机·外部中断·蜂鸣器·数码管·跑马灯
励志不掉头发的内向程序员2 小时前
STL库——二叉搜索树
开发语言·c++·学习
沧海一粟青草喂马3 小时前
抖音批量上传视频怎么弄?抖音矩阵账号管理的专业指南
大数据·人工智能·矩阵