深度学习中的过拟合问题及解决方式

深度学习中的过拟合问题及解决方式

什么是过拟合

过拟合指的是模型在训练数据上表现很好,能够非常好的拟合训练数据,但是不能很好的拟合不包含在训练数据中的其他数据的状态。即泛化能力很差。

过拟合的原因

  1. 模型拥有大量参数,表现力强。
  2. 训练数据少。

如何避免过拟合

权值衰减

什么是权值衰减

权值衰减指的是在训练过程中对较大的权重进行惩罚,来抑制过拟合。

如何实现权值衰减

先说结论,实现权值衰减的方式是在损失函数的基础上+权重的范数。

因为神经网络训练的目的就是减少损失函数的值,那么给损失函数加上一个值之后,如果要让损失函数变得更小,就要使的损失函数附加项更小,而附加项是权重的范数,自然调整的也是权重的大小。

常见范数

常见有L1范数、L2范数、L∞范数,以权重 W = ( ω 1 , ω 2 , ⋅ ⋅ ⋅ , ω n ) W=(\omega_1,\omega_2,···,\omega_n) W=(ω1,ω2,⋅⋅⋅,ωn)为例,说明几种范式的含义及如何计算。

其中L1范数是各个元素的绝对值之和,即 ∣ ω 1 ∣ + ∣ ω 2 ∣ + ⋅ ⋅ ⋅ + ∣ ω n ∣ |\omega_1|+|\omega_2|+···+|\omega_n| ∣ω1∣+∣ω2∣+⋅⋅⋅+∣ωn∣

L2范数是各个元素的平方和,即 ω 1 2 + ω 2 2 + ⋅ ⋅ ⋅ + ω n 2 \sqrt{\omega_1^2+\omega_2^2+···+\omega_n^2} ω12+ω22+⋅⋅⋅+ωn2

L∞范数也叫做Max范数,是各个元素的绝对值中最大的那一个,即 m a x ( ∣ ω 1 ∣ , ∣ ω 2 ∣ , ⋅ ⋅ ⋅ , ∣ ω n ∣ ) max(|\omega_1|,|\omega_2|,···,|\omega_n|) max(∣ω1∣,∣ω2∣,⋅⋅⋅,∣ωn∣)

Dropout

什么是Dropout

Dropout是一种在学习的过程中随即删除神经元的方法。训练时,随机选择隐藏层的神经元将其删除,被删除的信号源不再进行信号传递。

相关推荐
wen__xvn2 小时前
目标检测的局限
人工智能·目标检测·计算机视觉
力学与人工智能2 小时前
博士答辩PPT分享 | 高雷诺数湍流场数据同化与湍流模型机器学习研究
人工智能·机器学习·ppt分享·高雷诺数·流场数据同化·湍流模型
调参札记2 小时前
医学研究中的因果推断:重视态度与实践流程的结构性落差
人工智能
木卫四科技2 小时前
Chonkie 技术深度学习
人工智能·python·rag
努力毕业的小土博^_^2 小时前
【地学应用】溜砂坡scree slope / talus slope的定义、机制、分布、危害、与滑坡区别、研究方向与代表论文
人工智能·深度学习·遥感·地质灾害·地学应用
JeffDingAI2 小时前
【Datawhale学习笔记】基于Gensim的词向量实战
人工智能·笔记·学习
Ryan老房2 小时前
自动驾驶数据标注-L4-L5级别的数据挑战
人工智能·目标检测·目标跟踪·自动驾驶
weixin_398187752 小时前
YOLOv8结合SCI低光照图像增强算法实现夜晚目标检测
人工智能·yolo
万行2 小时前
机器人系统ROS2
人工智能·python·机器学习·机器人·计算机组成原理