MinMaxScaler, StandardScaler数据预处理中常用的两种缩放方法,用于将数据标准化或归一化到特定的范围或分布

MinMaxScalerStandardScaler 是数据预处理中常用的两种缩放方法,用于将数据标准化或归一化到特定的范围或分布。这两种缩放方法的主要区别在于它们的目标和实现方式。

MinMaxScaler

MinMaxScaler 会将数据缩放到一个指定的范围,通常是 [0, 1] 或 [-1, 1]。其目的是将数据映射到一个新的范围,使得数据的每个特征都有一个固定的范围。
MinMaxScaler 的数学表达式如下:
X scaled = X − X min X max − X min X_{\text{scaled}} = \frac{X - X_{\text{min}}}{X_{\text{max}} - X_{\text{min}}} Xscaled=Xmax−XminX−Xmin

这里, X min X_{\text{min}} Xmin 是数据中每个特征的最小值, X max X_{\text{max}} Xmax 是数据中每个特征的最大值。

StandardScaler

StandardScaler 则会将数据标准化到均值为 0,标准差为 1 的分布。其目的是使数据具有零均值和单位方差,这通常用于提高某些机器学习算法的性能。
StandardScaler 的数学表达式如下:
X scaled = X − μ σ X_{\text{scaled}} = \frac{X - \mu}{\sigma} Xscaled=σX−μ

这里, μ \mu μ 是数据中每个特征的均值, σ \sigma σ 是数据中每个特征的标准差。

使用场景

  • 当您希望每个特征的值都在一个固定的范围内时,例如在神经网络的输入层,MinMaxScaler 是一个很好的选择。
  • 当您希望特征具有零均值和单位方差时,例如在使用线性模型(如线性回归、逻辑回归)时,StandardScaler 通常是一个更好的选择。

实现

在 Python 的 scikit-learn 库中,您可以很容易地实现这两种缩放器。以下是 MinMaxScalerStandardScaler 的简单示例:

python 复制代码
from sklearn.preprocessing import MinMaxScaler, StandardScaler
import numpy as np
# 创建一个示例数据集
X = np.array([[1, 2], [3, 4], [5, 6]])
# 使用 MinMaxScaler
minmax_scaler = MinMaxScaler()
X_scaled_minmax = minmax_scaler.fit_transform(X)
# 使用 StandardScaler
standard_scaler = StandardScaler()
X_scaled_std = standard_scaler.fit_transform(X)

在实际应用中,选择哪种缩放器取决于您的具体需求和使用的算法。

相关推荐
maaath11 小时前
【maaath】Flutter for OpenHarmony 学习答题应用实战开发
学习·flutter·华为·harmonyos
xian_wwq12 小时前
【学习笔记】多租户的 Agent 隔离设计
笔记·学习
深蓝海拓12 小时前
PySide6,图形按钮使用系统内置图标
笔记·python·学习·pyqt
念恒1230612 小时前
Python(列表入门)
python·学习
十安_数学好题速析13 小时前
二进魔法:16人分组难题的4个月破解
笔记·学习·高考
承渊政道13 小时前
【动态规划算法】(子数组系列问题建模与解题思路精讲)
数据结构·c++·学习·算法·leetcode·动态规划·哈希算法
袋子(PJ)13 小时前
2026年pytorch基础学习(基于jupyter notebook开发)——从原理到落地:PyTorch神经网络架构与工程优化解析
人工智能·pytorch·深度学习·学习·jupyter
炽烈小老头13 小时前
【每天学习一点算法 2026/04/30】寻找重复数
学习·算法
YJlio13 小时前
《Windows Internals》10.5.1 ETW 概述:看懂 Windows 的“事件高速公路”
java·windows·笔记·stm32·嵌入式硬件·学习·eclipse
木木_王13 小时前
嵌入式Linux学习 | 数据结构 (Day03)顺序表与单链表 超详细解析(含 C 语言实现 + 作业 + 避坑指南)
linux·c语言·数据结构·学习