逻辑回归正则化解释性实验报告:L2 正则对模型系数收缩的可视化分析

逻辑回归正则化解释性实验报告

L2 正则化对模型系数的影响

L2 正则化(Ridge 正则化)通过在损失函数中增加系数的平方和惩罚项,约束模型复杂度,防止过拟合。其目标函数为:

J(\\theta) = -\\frac{1}{m} \\sum_{i=1}\^m \[y\^{(i)} \\log(h_\\theta(x\^{(i)})) + (1-y\^{(i)}) \\log(1-h_\\theta(x\^{(i)}))\] + \\frac{\\lambda}{2m} \\sum_{j=1}\^n \\theta_j\^2

其中 \\lambda 是正则化强度参数,\\theta_j 为模型系数。

实验设计与可视化方法

固定其他超参数(如学习率、迭代次数),逐步增大 \\lambda 值(例如从 0.01 到 100),记录每次训练后模型系数的绝对值。

使用 Python 的 sklearn.linear_model.LogisticRegression 实现,设置 penalty='l2',并通过 coef_ 属性提取系数。

python 复制代码
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression

# 模拟数据
X = np.random.randn(100, 5)
y = np.random.randint(0, 2, 100)

# 不同 lambda 值(C=1/lambda)
lambdas = np.logspace(-2, 2, 20)
coefs = []
for l in lambdas:
    model = LogisticRegression(penalty='l2', C=1/l, solver='liblinear')
    model.fit(X, y)
    coefs.append(np.abs(model.coef_[0]))

# 可视化
plt.figure(figsize=(10, 6))
for i in range(5):
    plt.plot(lambdas, [c[i] for c in coefs], label=f'Feature {i+1}')
plt.xscale('log')
plt.xlabel('Lambda (Regularization Strength)')
plt.ylabel('Absolute Coefficient Value')
plt.title('L2 Regularization Effect on Logistic Regression Coefficients')
plt.legend()
plt.grid(True)
plt.show()
典型可视化结果分析
  • \\lambda 值(弱正则化):系数接近无正则化时的原始值,模型可能过拟合。
  • 中等 \\lambda:系数被均匀压缩,但保留相对重要性排序。
  • \\lambda 值(强正则化):所有系数趋近于零,模型趋向欠拟合。
关键结论
  1. L2 正则化会平滑地减小所有系数的绝对值,但通常不会将任何系数压缩至零。
  2. 特征重要性排序在适度正则化下保持稳定,适用于需要保留所有特征的场景。
  3. 最优 \\lambda 需通过交叉验证确定,平衡偏差与方差。
相关推荐
数智工坊14 分钟前
【UniT论文阅读】:用统一物理语言打通人类与人形机器人的知识壁垒
论文阅读·人工智能·深度学习·算法·机器人
梓䈑16 分钟前
【算法题攻略】模拟
c++·算法
Evand J19 分钟前
【课题推荐与代码介绍】卡尔曼滤波器正反向估计算法原理与MATLAB实现
开发语言·算法·matlab
DFT计算杂谈22 分钟前
VASP新手入门: IVDW 色散修正参数
linux·运维·服务器·python·算法
AI医影跨模态组学35 分钟前
eClinMed 遵义医科大学附属医院:肺癌术后肺部并发症可解释机器学习预测模型的开发与验证:一项机器学习研究
人工智能·深度学习·机器学习·论文·医学影像·影像组学
吃着火锅x唱着歌38 分钟前
LeetCode 962.最大宽度坡
算法·leetcode·职场和发展
无限进步_1 小时前
【C++】C++11的类功能增强与STL变化
java·前端·数据结构·c++·后端·算法
高洁011 小时前
中国人工智能培训网—AI系列录播课
人工智能·机器学习·数据挖掘·transformer·知识图谱
WL_Aurora1 小时前
Python 算法基础篇之排序算法(一):冒泡、选择、插入
python·算法·排序算法
凌波粒1 小时前
LeetCode--257. 二叉树的所有路径(二叉树)
算法·leetcode·职场和发展