[动手学习深度学习]13.丢弃法 Dropout

权重衰退是常见处理过拟合的方法

丢弃法比权重衰退效果要好

动机

  • 一个好的模型 需要第输入数据的扰动具有鲁棒性
    • 使用有噪音的数据等价于Tikhonov正则
    • 丢弃法:在层之间加入噪音

(所以丢弃法其实是一个正则)

无偏差的加入噪音

  • 对x加入噪音得到x',我们希望
    E [ x ′ ] = x E[x'] = x E[x′]=x
  • 丢弃法对每个元素进行如下扰动

使用

通常将丢弃法作用在隐藏全连接层的输出上

对隐藏层的每一个神经元做dropout,使每一个都有p概率变为0

即去掉一些权重(每次可能去掉的不一样)

在训练中使用

推理中的丢弃法

  • 正则项只在训练中使用:他们影响模型参数的更新

  • 在推理过程中,dropout直接返回输入

    python 复制代码
    h=dropout(h)

    这样也能保证确定性的输出
    每次随机的采样一些子神经网络

总结

  • 丢弃法将一些输出项随机置0来控制模型复杂度
  • 常作用在多层感知机的隐藏层输出上
  • 丢弃概率使控制模型复杂度的超参数
相关推荐
蓝婷儿2 分钟前
Python 机器学习核心入门与实战进阶 Day 3 - 决策树 & 随机森林模型实战
人工智能·python·机器学习
大千AI助手5 分钟前
PageRank:互联网的马尔可夫链平衡态
人工智能·机器学习·贝叶斯·mc·pagerank·条件概率·马尔科夫链
小和尚同志28 分钟前
Cline | Cline + Grok3 免费 AI 编程新体验
人工智能·aigc
大苏打seven33 分钟前
Docker学习笔记:Docker网络
笔记·学习·docker
我就是全世界39 分钟前
TensorRT-LLM:大模型推理加速的核心技术与实践优势
人工智能·机器学习·性能优化·大模型·tensorrt-llm
.30-06Springfield43 分钟前
决策树(Decision tree)算法详解(ID3、C4.5、CART)
人工智能·python·算法·决策树·机器学习
我不是哆啦A梦43 分钟前
破解风电运维“百模大战”困局,机械版ChatGPT诞生?
运维·人工智能·python·算法·chatgpt
galaxylove1 小时前
Gartner发布塑造安全运营未来的关键 AI 自动化趋势
人工智能·安全·自动化
强哥之神2 小时前
英伟达发布 Llama Nemotron Nano 4B:专为边缘 AI 和科研任务优化的高效开源推理模型
人工智能·深度学习·语言模型·架构·llm·transformer·边缘计算
Green1Leaves2 小时前
pytorch学习-9.多分类问题
人工智能·pytorch·学习