【AI学习】聊两句深度学习的目标函数

在阅读《动手学深度学习》一书中,看到这样一段话:

"导数的计算,这是⼏乎所有深度学习优化算法的关键步骤。

在深度学习中,我们通常选择对于模型参数可微的损失函数。简⽽⾔之,对于每个参数,如果我们把这个参数增加或减少⼀个⽆穷⼩的量,我们可以知道损失会以多快的速度增加或减少。"

前面的文章也提到:深度学习回答了什么样的神经网络可以训练出智能,包括多层神经网络和卷积神经网络,也回答了训练(学习)方法问题,包括受限玻尔兹曼机模型、反向传播算法、自编码模型等。

反向传播算法,也就是反向导数传播,通过计算损失函数的损失,利用损失函数对于模型参数的可微性,将损失调整转换为模型参数的导数传播。这差不多是深度学习关键方法。由此也让深度学习模型成为函数的万能逼近器。

那如何目标函数不可微,怎么办?一种就是重参数化,类似VAE论文中采用方法。另一种就是采用强化学习,类似RLHF的方法。

相关推荐
Engineer邓祥浩14 小时前
设计模式学习(10) 23-8 装饰者模式
python·学习·设计模式
乾元14 小时前
构建你的个人「网络 AI 实验室」——硬件、模拟器与数据集清单
运维·网络·人工智能·网络协议·架构
lkbhua莱克瓦2414 小时前
机器学习的演进与深度学习的革命
人工智能·深度学习·机器学习
楚来客14 小时前
AI基础概念之九:神经网络单层感知机的基本原理
人工智能·神经网络·cnn
北京耐用通信14 小时前
耐达讯自动化 Profibus 总线光纤中继器:解决半导体设备通信难题,提升产线效率
网络·人工智能·物联网·自动化·信息与通信
大强同学15 小时前
7个优质精选Claude Skills
人工智能
Errorbot15 小时前
F570四轴飞行器学习笔记
笔记·学习·无人机
GISer_Jing15 小时前
AI学习资源总结:免费开放,入门至深入,持续更新
人工智能·学习·设计模式·prompt·aigc
聊聊科技15 小时前
音乐平台批量demo更新频繁,AI代唱demo软件助音乐人快速响应
人工智能
IT_陈寒15 小时前
SpringBoot 3.2实战:5个性能优化技巧让你的应用提速50%
前端·人工智能·后端