深度学习与数学归纳法

最近发现,深度学习可以分为两个主要的阶段,分别是前向推理以及反向传播,分别对应着网络的推理和参数训练两个步骤。其中推理有时候也称为归纳推理。

在做参数训练的时候,本质上是在利用历史数据求网络参数的先验分布; p ( θ ∣ x , y ) p(\theta | x,y) p(θ∣x,y)

在推理的时候,本质是在基于训练好的参数进行极大似然估计。 p ( y ∣ x , θ ) p(y |x, \theta) p(y∣x,θ)

此外,深度学习解决问题时,往往先假设所有的参数都能够训练到最优 θ ∗ \theta^* θ∗,然后在这个最优训练参数假设下构建前向网络进行建模。等建模表征完之后,再去基于数据和优化器把参数训练到最优。这个思想其实和数学归纳法里面的先假设某个条件成立,再去做其他事情,然后再反过来优化这个条件很像,也和EM估计的思想很像。

这也可以解释为什么很多网络结构的改进的论文,本质上是提供了参数交互的接口,让网络有机会对某种类型的数据进行建模和表征,然后再去对其进行训练。

相关推荐
物联网软硬件开发-轨物科技14 分钟前
【轨物方案】新能源的下半场:构筑光伏场站全生命周期智慧运维新范式
大数据·人工智能·物联网
2501_9361460417 分钟前
【目标检测】钙钛矿晶体YOLO11-GhostDynamicConv模型改进与实现_1
人工智能·目标检测·计算机视觉
Deepoch21 分钟前
Deepoc具身模型:电厂巡检机械狗的智能核心
人工智能·科技·机器狗·具身模型·deepoc·机械狗·巡检机械狗
好奇龙猫5 小时前
【人工智能学习-AI入试相关题目练习-第七次】
人工智能·学习
Mao.O7 小时前
开源项目“AI思维圆桌”的介绍和对于当前AI编程的思考
人工智能
jake don7 小时前
AI 深度学习路线
人工智能·深度学习
信创天地8 小时前
信创场景软件兼容性测试实战:适配国产软硬件生态,破解运行故障难题
人工智能·开源·dubbo·运维开发·risc-v
幻云20108 小时前
Python深度学习:从筑基到登仙
前端·javascript·vue.js·人工智能·python
bst@微胖子8 小时前
LlamaIndex之核心概念及部署以及入门案例
pytorch·深度学习·机器学习
无风听海8 小时前
CBOW 模型中的输出层
人工智能·机器学习