deep learning(李宏毅)--(六)--loss

一,关于分类问题及其损失函数的一些讨论。

在构建分类模型是,我们的最后一层往往是softmax函数(起到归一化的作用),如果是二分类问题也可以用sigmoid函数。

在loss函数的选择上,一般采用交叉熵损失函数(cross-entropy),为什么呢?因为交叉熵损失函数更容易使得optimisization到达低loss(如下图:cross-entropy的梯度图更为陡)

二,对于Adam和SGDM梯度优化算法的比较

Adam:训练速度很快,但是收敛效果不佳

SGDM:训练速度平稳,收敛性较好

SWATS算法:Adam和SGDM算法的结合:(训练开始用Adam,在收敛时用SGDM)

注意:使用Adam算法初始不稳定,需要进行预加热(Warm up) .

三,Radam算法与SWATS算法比较:

后面就有点听不懂了,以后了解更多再来听吧,做个记号。
(选修)To Learn More - Optimization for Deep Learning (2_2)_哔哩哔哩_bilibili
笔记先做到这hh,有的笨,当先了解了。

相关推荐
knight_9___4 分钟前
大模型project面试7
人工智能·python·算法·面试·大模型·agent
liudanzhengxi5 分钟前
CRM系统技术文章
linux·服务器·网络·人工智能·新人首发
JavaAgent架构师8 分钟前
前端AI工程化(六):Function Calling与RAG前端实践
前端·人工智能
ZhengEnCi12 分钟前
08-编码器结构 🏗️
人工智能
掘金安东尼15 分钟前
Buildsom |老板说要加码 AI 推广?我调研后发现:77% 的品牌,其实都在“盲投”
人工智能
Android出海16 分钟前
5月合规风暴眼:Google Play权限大限与欧盟游戏监管新棋局
人工智能·游戏·google play·谷歌开发者·android开发者·google开发者·google play开发者
在繁华处19 分钟前
轻棋局(一):项目总览与架构设计
人工智能·windows
TechubNews1 小时前
稳定币下一战:不是谁发币,而是谁掌握结算通道
人工智能·web3·区块链
多年小白1 小时前
紫光国微(002049) 分析
大数据·科技·深度学习·ai
火山引擎开发者社区1 小时前
钛投标基于火山引擎 ArkClaw 构建招投标垂直智能服务生态
人工智能