【机器学习】正则化

正则化是防止模型过拟合的方法,它通过对模型的权重进行约束来控制模型的复杂度。

正则化在损失函数中引入模型复杂度指标,利用给W加权值,弱化了数据的噪声,一般不正则化b。

  • loss(y^,y):模型中所有参数的损失函数,如交叉熵
  • Regularizer:用超参数Regularizer给出w在总loss中的比例,即正则化的权重。
  • w:需要正则化的参数

正则化分为L1正则化和L2正则化:

L1正则化大概率会使很多参数变为0,因此该方法可通过稀疏参数,即减少参数的数量,降低复杂度。

L2正则化会使参数很接近但不为零,因此该方法可通过减小参数值的大小降低复杂度。

来源推导

对于模型权重系数 w 求解是通过最小化目标函数实现的,即求解:

使用

假如我们有非常多的特征,我们并不知道其中哪些特征我们要惩罚,我们将对所有的特征进行惩罚,并且让代价函数最优化的程序来选择这些惩罚的程度。记:

对线性回归:

对逻辑回归:

相关推荐
GMICLOUD1 分钟前
GMI Cloud@AI 周报 | DeepSeek V3.2 系列震撼开源;Claude Opus 4.5 发布
人工智能·ai·ai资讯
QT 小鲜肉4 分钟前
【孙子兵法之中篇】009. 孙子兵法·行军篇
人工智能·笔记·读书·孙子兵法
FL16238631296 分钟前
智慧工地建筑工地常见装备手推车切割机安全帽检测数据集VOC+YOLO格式13364张15类别
深度学习·yolo·机器学习
c#上位机9 分钟前
halcon计算区域骨架
图像处理·人工智能·计算机视觉·c#·halcon
天一生水water14 分钟前
储层认知→技术落地→产量优化
人工智能·算法·机器学习
华清远见成都中心17 分钟前
人工智能的关键技术有哪些?
人工智能
绿蕉17 分钟前
智能底盘:汽车革命的“新基石”
大数据·人工智能
GAOJ_K18 分钟前
滚珠花键的使用时长与性能保持的量化关系
大数据·人工智能·科技·自动化·制造
天一生水water22 分钟前
页岩油生产流程案例
人工智能·智慧油田
Yeliang Wu29 分钟前
算力自由:用K8s和Ollama打造你的专属AI基础设施
人工智能·容器·kubernetes