【AI学习】聊两句深度学习的目标函数

在阅读《动手学深度学习》一书中,看到这样一段话:

"导数的计算,这是⼏乎所有深度学习优化算法的关键步骤。

在深度学习中,我们通常选择对于模型参数可微的损失函数。简⽽⾔之,对于每个参数,如果我们把这个参数增加或减少⼀个⽆穷⼩的量,我们可以知道损失会以多快的速度增加或减少。"

前面的文章也提到:深度学习回答了什么样的神经网络可以训练出智能,包括多层神经网络和卷积神经网络,也回答了训练(学习)方法问题,包括受限玻尔兹曼机模型、反向传播算法、自编码模型等。

反向传播算法,也就是反向导数传播,通过计算损失函数的损失,利用损失函数对于模型参数的可微性,将损失调整转换为模型参数的导数传播。这差不多是深度学习关键方法。由此也让深度学习模型成为函数的万能逼近器。

那如何目标函数不可微,怎么办?一种就是重参数化,类似VAE论文中采用方法。另一种就是采用强化学习,类似RLHF的方法。

相关推荐
崇山峻岭之间2 分钟前
Matlab学习记录36
学习
m0_748254664 分钟前
CSS AI 编程
前端·css·人工智能
永远快乐的攻城狮6 分钟前
二、学习电子元器件-电阻器
学习
愚公搬代码8 分钟前
【愚公系列】《AI+直播营销》030-主播的选拔和人设设计(选拔匹配的主播)
人工智能
三不原则12 分钟前
故障案例:告警风暴处理,用 AI 实现告警聚合与降噪
人工智能
这张生成的图像能检测吗14 分钟前
(论文速读)GNS:学习用图网络模拟复杂物理
人工智能·图神经网络·物理模型
童话名剑19 分钟前
神经风格迁移(吴恩达深度学习笔记)
深度学习·机器学习·计算机视觉·特征检测·神经风格迁移
HySpark21 分钟前
基于语音转文字与语义分析的智能语音识别技术
人工智能·语音识别
Coder_Boy_25 分钟前
基于SpringAI的在线考试系统-考试模块前端页面交互设计及优化
java·数据库·人工智能·spring boot
Maddie_Mo32 分钟前
智能体设计模式 第一章:提示链
人工智能·python·语言模型·rag