2022最新版-李宏毅机器学习深度学习课程-P26RNN-2

一、RNN网络结构

与时间有关的反向传播(每次不同)

损失函数

实验其实不容易跑,因为他的损失函数曲线幅度很大

画出来差不多是这个样子。突然一下升高是因为从右到左碰到陡峭的地方梯度一下变大了,所以弹回去了。

原作者在训练时加上了小技巧------clipping:设置一个峰值,若超过则等于该峰值。

梯度大的原因:

  • 当W>1时,微小的变化会引起很大的变化;
  • 当w<1时,较大的变化带来的变化也很小。

RNN一些有用的变形

LSTM以及简化为双门的GRU

Clockwise RNN && SCRN

多对一

多长对多短

这里是最后删去重复的字符

改加上null符号后,可以实现一些叠词

CTC方法

多对多(无限制)

加上一个断的符号,可以及时终止

可以用在机器学习上

语法分析

自动编码器

可以提高传输效率和节约成本

相关推荐
机器之心20 小时前
大佬深度解析:Coding Agent的底层运行逻辑是什么?
人工智能·openai
爱吃的小肥羊20 小时前
Claude降智再被实锤!推理能力严重下滑,用户连夜跑路 Codex
人工智能·aigc·openai
Rabbit_QL20 小时前
【理论分析】信息熵的极值问题:什么时候最小?什么时候最大?
人工智能·深度学习
❀͜͡傀儡师20 小时前
Spring AI Alibaba vs. AgentScope:两个阿里AI框架,如何选择?
java·人工智能·spring
njsgcs21 小时前
MPNN框架 消息生成与聚合 (公式 1)
人工智能
格林威21 小时前
AI视觉检测:INT8 量化对工业视觉检测精度的影响
linux·运维·人工智能·数码相机·计算机视觉·视觉检测·工业相机
新缸中之脑21 小时前
ROS 2 Composition简明教程
人工智能
艾为电子21 小时前
【应用方案】会议&面试记录终结者-艾为AI智能录音卡方案,清晰拾音,解放双手
人工智能·ai
AI攻城狮21 小时前
Adaptive Thinking 的代价:当 AI 自己决定"想多少"
人工智能·云原生·aigc
Z.风止21 小时前
Large Model-learning(3)
人工智能·笔记·后端·深度学习