python
from sklearn.preprocessing import StandardScaler
import numpy as np
# 原始数据(假设为2个特征,5个样本)
data = np.array([[20, 5000], [22, 6000], [25, 8000], [28, 9000], [30, 10000]])
# 初始化标准化器
scaler = StandardScaler()
# 用训练集拟合(计算均值和标准差)并转换
data_scaled = scaler.fit_transform(data)
print("标准化后数据:")
print(data_scaled)
print("各特征均值(应接近0):", scaler.mean_)
print("各特征标准差(应接近1):", scaler.scale_)
综上,Z-score 标准化是数值型特征预处理的基础方法,核心是 "通过均值和标准差调整数据分布",需根据模型特性和数据分布选择,同时注意避免数据泄露和异常值干扰。