机器学习和数据挖掘04-PowerTransformer与 MinMaxScaler

概念 PowerTransformer(幂变换器)

PowerTransformer 是用于对数据进行幂变换(也称为Box-Cox变换)的预处理工具。幂变换可以使数据更接近正态分布,这有助于某些机器学习算法的性能提升。它支持两种常用的幂变换:Yeo-Johnson变换和Box-Cox变换。

代码实现

python 复制代码
from sklearn.preprocessing import PowerTransformer
import numpy as np

data = np.array([[1.0], [2.0], [3.0], [4.0], [5.0]])

transformer = PowerTransformer(method='yeo-johnson')
transformed_data = transformer.fit_transform(data)

print("Original Data:\n", data)
print("Transformed Data:\n", transformed_data)

概念MinMaxScaler(最小-最大缩放器)

MinMaxScaler 是用于将数据进行最小-最大缩放的预处理工具。它将数据缩放到指定的范围,通常是

0,到。这对于那些受到特征尺度影响的算法(如K近邻和支持向量机)非常有用。

代码实现

python 复制代码
from sklearn.preprocessing import MinMaxScaler
import numpy as np

data = np.array([[1.0], [2.0], [3.0], [4.0], [5.0]])

scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(data)

print("Original Data:\n", data)
print("Scaled Data:\n", scaled_data)
相关推荐
智慧景区与市集主理人1 小时前
五一乡村文旅增收难?巨有科技大数据双赋能破局突围
大数据·科技
TechubNews4 小时前
新火集团首席经济学家付鹏演讲——2026 年是 Crypto 加入到 FICC 资产配置框架元年
大数据·人工智能
DeepModel5 小时前
通俗易懂讲透 Q-Learning:从零学会强化学习核心算法
人工智能·学习·算法·机器学习
Elastic 中国社区官方博客5 小时前
为 Elastic Cloud Serverless 和 Elasticsearch 引入统一的 API 密钥
大数据·运维·elasticsearch·搜索引擎·云原生·serverless
聊点儿技术5 小时前
LLM数据采集如何突破AI反爬?——用IP数据接口实现进阶
人工智能·数据分析·产品运营·ip·电商·ip地址查询·ip数据接口
handler016 小时前
从零实现自动化构建:Linux Makefile 完全指南
linux·c++·笔记·学习·自动化
安小牛7 小时前
Android 开发汉字转带声调的拼音
android·java·学习·android studio
赵钰老师7 小时前
【结构方程模型SEM】最新基于R语言结构方程模型分析
开发语言·数据分析·r语言
Hello_Embed7 小时前
嵌入式上位机开发入门(二十六):将 MQTT 测试程序加入 APP 任务
网络·笔记·网络协议·tcp/ip·嵌入式
不会编程的懒洋洋7 小时前
C# Task async/await CancellationToken
笔记·c#·线程·面向对象·task·同步异步