机器学习-正则化线性回归

如上图我们不需要对b进行正则化,w控制着特征的影响强度,W太大会容易让模型对训练数据过于敏感,造成过拟合,而B是偏置项,相当于对所有样本添加了一个固定值,,他的大小对模型的影响很小,不会导致过拟合额,他只影响模型的整体平移

我么看一下正则化是做了什么

我们对正则化的式子展开并且重新排列,会发现 后面的一项其实就是 没有正则化线性回归时候的梯度下降方程,我们看前一项, w和一个东西想成,如果我们找到一些数据带入到这一块中,如右图,我们可以发现 相当于是将W乘以了一个参数,这个参数的大小和 lamdba 有关,在右边的数据可以看出,相当于每次都对W乘以了一个小于1 但是近似与1的数进行变化,相当于每次都对W进行了一次小缩放,以防止过拟合

实际上 学习率是一个很小的数字,样本数据也是足够多的,lamdba 也是最够小的,这会导致 W会乘以一个小于1的但是很接近于1的数字,对W进行 打折每次都会打折,进行迭代

我们从式子可以看出,

lamdba 是和这个w相乘的系数是成反比的,

这个系数和模型的拟合能力是成反比的,

所以lamdba和模型的拟合能力是成正比的

lamdba 越大,系数越小 ,对W的惩罚越大,w就会越小,模型就越简单,模型就会欠拟合

lamdba 越小,对w的约束就会越小,模型就会过拟合,

lamdba 就是W的调节器,是反相关的

w的大小决定了模型的拟合深度,w大过拟合,W小欠拟合

lamdba 越大 模型就会欠拟合

lamdba 越小 模型就会过拟合

推导过程如小图

相关推荐
guslegend3 分钟前
第5节:动态切片策略与重叠机制提升RAG召回率
人工智能·大模型·rag
V搜xhliang02464 分钟前
AI大模型在临床决策与手术机器人领域的应用
大数据·人工智能·机器人
Captain_Data7 分钟前
Python机器学习sklearn线性模型完整指南:LinearRegression/Ridge/Lasso详细代码注释
python·机器学习·数据分析·线性回归·sklearn
数据堂官方账号11 分钟前
数据竞赛 | 第二届多语种对话语音语言模型(MLC-SLM)挑战赛正式开启
人工智能·语言模型·自然语言处理·语音语言模型
Agent产品评测局16 分钟前
企业数据处理自动化落地,抓取分析全流程实现方案 —— 2026企业级智能体选型与技术路径深度解析
运维·人工智能·ai·自动化
大强同学27 分钟前
对比 VS Code:Zed 编辑器编码体验全面解析
人工智能·windows·编辑器·ai编程
熊猫钓鱼>_>27 分钟前
从“流程固化“到“意图驱动“:大模型调智能体调Skill架构深度解析
ai·架构·大模型·llm·agent·skill·openclaw
豆沙糕36 分钟前
RAG文档切分最佳实践:企业级方案+主流策略+生产落地
数据库·人工智能
minglie136 分钟前
zynq环境用opencv测摄像头
人工智能·opencv·计算机视觉
xyz_CDragon1 小时前
OpenClaw Skills 完全指南:ClawHub 安装、安全避坑与自定义开发(2026)
人工智能·python·ai·skill·openclaw·clawhub