【AI学习】聊两句深度学习的目标函数

在阅读《动手学深度学习》一书中,看到这样一段话:

"导数的计算,这是⼏乎所有深度学习优化算法的关键步骤。

在深度学习中,我们通常选择对于模型参数可微的损失函数。简⽽⾔之,对于每个参数,如果我们把这个参数增加或减少⼀个⽆穷⼩的量,我们可以知道损失会以多快的速度增加或减少。"

前面的文章也提到:深度学习回答了什么样的神经网络可以训练出智能,包括多层神经网络和卷积神经网络,也回答了训练(学习)方法问题,包括受限玻尔兹曼机模型、反向传播算法、自编码模型等。

反向传播算法,也就是反向导数传播,通过计算损失函数的损失,利用损失函数对于模型参数的可微性,将损失调整转换为模型参数的导数传播。这差不多是深度学习关键方法。由此也让深度学习模型成为函数的万能逼近器。

那如何目标函数不可微,怎么办?一种就是重参数化,类似VAE论文中采用方法。另一种就是采用强化学习,类似RLHF的方法。

相关推荐
虹科网络安全1 分钟前
艾体宝案例 | 从关系到语义:ArangoDB如何支撑高精度水军识别
人工智能
jz_ddk5 分钟前
[学习] 卫星导航的码相位与载波相位计算
学习·算法·gps·gnss·北斗
大霸王龙11 分钟前
MinIO 对象存储系统架构图集
人工智能·llm·minio
汗流浃背了吧,老弟!14 分钟前
什么是ResNet
人工智能·深度学习
哥布林学者20 分钟前
吴恩达深度学习课程五:自然语言处理 第一周:循环神经网络 (三)语言模型
深度学习·ai
小途软件22 分钟前
高校宿舍访客预约管理平台开发
java·人工智能·pytorch·python·深度学习·语言模型
人工智能培训1 小时前
10分钟了解向量数据库(3)
人工智能·大模型·知识图谱·强化学习·智能体搭建
华清远见成都中心1 小时前
人工智能要学习的课程有哪些?
人工智能·学习
普通网友1 小时前
Bard 的模型压缩技术:在保证性能的前提下如何实现轻量化部署
人工智能·机器学习·bard
hssfscv1 小时前
Javaweb学习笔记——后端实战2_部门管理
java·笔记·学习