[动手学习深度学习]13.丢弃法 Dropout

晴空对晚照2025-03-12 11:58

权重衰退是常见处理过拟合的方法

丢弃法比权重衰退效果要好

动机

一个好的模型需要第输入数据的扰动具有鲁棒性
- 使用有噪音的数据等价于Tikhonov正则
- 丢弃法：在层之间加入噪音

（所以丢弃法其实是一个正则）

无偏差的加入噪音

对x加入噪音得到x'，我们希望
E [ x ′ ] = x E[x'] = x E[x′]=x
丢弃法对每个元素进行如下扰动

使用

通常将丢弃法作用在隐藏全连接层的输出上

对隐藏层的每一个神经元做dropout，使每一个都有p概率变为0

即去掉一些权重（每次可能去掉的不一样）

在训练中使用

推理中的丢弃法

正则项只在训练中使用：他们影响模型参数的更新
在推理过程中，dropout直接返回输入
python 复制代码
```
h=dropout(h)
```
这样也能保证确定性的输出
每次随机的采样一些子神经网络

总结

丢弃法将一些输出项随机置0来控制模型复杂度
常作用在多层感知机的隐藏层输出上
丢弃概率使控制模型复杂度的超参数

上一篇：【最新】DeepSeek 实用集成工具有那些？

下一篇：【Python 2D绘图】Matplotlib绘图（统计图表）

热门推荐

01GitHub 镜像站点 02【保姆级教程】免费使用Gemini3的5种方法！免翻墙/国内直连 03BongoCat - 跨平台键盘猫动画工具 04UV安装并设置国内源 05安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）06Linux下V2Ray安装配置指南 07Google Antigravity：无法登录？早期错误、登录修复和用户反馈指南 08Labelme从安装到标注：零基础完整指南 09全球最强模型Grok4，国内已可免费使用！（附教程）1046个Nano-banana 精选提示词，持续更新中