2022最新版-李宏毅机器学习深度学习课程-P26RNN-2

一、RNN网络结构

与时间有关的反向传播(每次不同)

损失函数

实验其实不容易跑,因为他的损失函数曲线幅度很大

画出来差不多是这个样子。突然一下升高是因为从右到左碰到陡峭的地方梯度一下变大了,所以弹回去了。

原作者在训练时加上了小技巧------clipping:设置一个峰值,若超过则等于该峰值。

梯度大的原因:

  • 当W>1时,微小的变化会引起很大的变化;
  • 当w<1时,较大的变化带来的变化也很小。

RNN一些有用的变形

LSTM以及简化为双门的GRU

Clockwise RNN && SCRN

多对一

多长对多短

这里是最后删去重复的字符

改加上null符号后,可以实现一些叠词

CTC方法

多对多(无限制)

加上一个断的符号,可以及时终止

可以用在机器学习上

语法分析

自动编码器

可以提高传输效率和节约成本

相关推荐
tap.AI3 分钟前
Deepseek(九)多语言客服自动化:跨境电商中的多币种、多语种投诉实时处理
运维·人工智能·自动化
好奇龙猫9 分钟前
【人工智能学习-AI-MIT公开课第 20・21 概率推理】
人工智能·学习
实战项目11 分钟前
边缘计算在智慧物流中的实时跟踪应用
人工智能·边缘计算
绀目澄清13 分钟前
Unity 的AI Navigation 系统详细总结
人工智能·unity·游戏引擎
一招定胜负13 分钟前
图像形态学+边缘检测及CNN关联
人工智能·深度学习·cnn
dagouaofei14 分钟前
2026 年工作计划 PPT 制作方式对比:AI 与传统方法差异
人工智能·python·powerpoint
万行35 分钟前
机器学习&第五章生成式生成器
人工智能·python·算法·机器学习
独自破碎E35 分钟前
介绍一下Spring AI框架
java·人工智能·spring
laplace012336 分钟前
第三章 大语言模型基础
人工智能·语言模型·自然语言处理·agent·rag
Lun3866buzha1 小时前
轮胎胎面花纹识别与分类:基于solo_r50_fpn模型的实现与优化
人工智能·分类·数据挖掘