什么是Z-score标准化

Liquad Li2025-09-03 9:13

python 复制代码

from sklearn.preprocessing import StandardScaler
import numpy as np

# 原始数据（假设为2个特征，5个样本）
data = np.array([[20, 5000], [22, 6000], [25, 8000], [28, 9000], [30, 10000]])

# 初始化标准化器
scaler = StandardScaler()

# 用训练集拟合（计算均值和标准差）并转换
data_scaled = scaler.fit_transform(data)

print("标准化后数据：")
print(data_scaled)
print("各特征均值（应接近0）：", scaler.mean_)
print("各特征标准差（应接近1）：", scaler.scale_)

综上，Z-score 标准化是数值型特征预处理的基础方法，核心是 "通过均值和标准差调整数据分布"，需根据模型特性和数据分布选择，同时注意避免数据泄露和异常值干扰。