深度学习中的过拟合问题及解决方式

Where-2026-01-18 20:32

深度学习中的过拟合问题及解决方式

什么是过拟合
过拟合的原因
如何避免过拟合

什么是过拟合

过拟合指的是模型在训练数据上表现很好，能够非常好的拟合训练数据，但是不能很好的拟合不包含在训练数据中的其他数据的状态。即泛化能力很差。

过拟合的原因

模型拥有大量参数，表现力强。
训练数据少。

如何避免过拟合

权值衰减

什么是权值衰减

权值衰减指的是在训练过程中对较大的权重进行惩罚，来抑制过拟合。

如何实现权值衰减

先说结论，实现权值衰减的方式是在损失函数的基础上+权重的范数。

因为神经网络训练的目的就是减少损失函数的值，那么给损失函数加上一个值之后，如果要让损失函数变得更小，就要使的损失函数附加项更小，而附加项是权重的范数，自然调整的也是权重的大小。

常见范数

常见有L1范数、L2范数、L∞范数，以权重 W = ( ω 1 , ω 2 , ⋅ ⋅ ⋅ ， ω n ) W=(\omega_1,\omega_2,···，\omega_n) W=(ω1,ω2,⋅⋅⋅，ωn)为例，说明几种范式的含义及如何计算。

其中L1范数是各个元素的绝对值之和，即 ∣ ω 1 ∣ + ∣ ω 2 ∣ + ⋅ ⋅ ⋅ + ∣ ω n ∣ |\omega_1|+|\omega_2|+···+|\omega_n| ∣ω1∣+∣ω2∣+⋅⋅⋅+∣ωn∣

L2范数是各个元素的平方和，即 ω 1 2 + ω 2 2 + ⋅ ⋅ ⋅ + ω n 2 \sqrt{\omega_1^2+\omega_2^2+···+\omega_n^2} ω12+ω22+⋅⋅⋅+ωn2

L∞范数也叫做Max范数，是各个元素的绝对值中最大的那一个，即 m a x ( ∣ ω 1 ∣ , ∣ ω 2 ∣ , ⋅ ⋅ ⋅ , ∣ ω n ∣ ) max(|\omega_1|,|\omega_2|,···,|\omega_n|) max(∣ω1∣,∣ω2∣,⋅⋅⋅,∣ωn∣)

Dropout

什么是Dropout

Dropout是一种在学习的过程中随即删除神经元的方法。训练时，随机选择隐藏层的神经元将其删除，被删除的信号源不再进行信号传递。

上一篇：广域网往返（WAN RTT）优化案例（6）

下一篇：2026年华研就业实践营｜走进字节跳动，解锁科技行业职业新航向

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03AI科技热点日报 | 2026年07月01日 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07Codex 下载安装指南：Windows 和 macOS 官方版下载 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026 年 AI 大模型 & AI 编程工具实战全总结 10全面体验 Grok API 中转站（2025 · Grok 4 系列最新版）