2022最新版-李宏毅机器学习深度学习课程-P26RNN-2

一、RNN网络结构

与时间有关的反向传播(每次不同)

损失函数

实验其实不容易跑,因为他的损失函数曲线幅度很大

画出来差不多是这个样子。突然一下升高是因为从右到左碰到陡峭的地方梯度一下变大了,所以弹回去了。

原作者在训练时加上了小技巧------clipping:设置一个峰值,若超过则等于该峰值。

梯度大的原因:

  • 当W>1时,微小的变化会引起很大的变化;
  • 当w<1时,较大的变化带来的变化也很小。

RNN一些有用的变形

LSTM以及简化为双门的GRU

Clockwise RNN && SCRN

多对一

多长对多短

这里是最后删去重复的字符

改加上null符号后,可以实现一些叠词

CTC方法

多对多(无限制)

加上一个断的符号,可以及时终止

可以用在机器学习上

语法分析

自动编码器

可以提高传输效率和节约成本

相关推荐
AI大模型知识分享2 分钟前
零基础入门AI:一键本地运行各种开源大语言模型 - Ollama
人工智能·gpt·语言模型·自然语言处理·chatgpt·开源·prompt
深度学习实战训练营25 分钟前
VGG16模型实现新冠肺炎图片多分类
人工智能·分类·数据挖掘
网络研究院3 小时前
人工智能有助于解决 IT/OT 集成安全挑战
网络·人工智能·安全·报告·工业·状况
七哥的AI日常4 小时前
个人随想-gpt-o1大模型中推理链的一个落地实现
人工智能
985小水博一枚呀7 小时前
【深度学习|可视化】如何以图形化的方式展示神经网络的结构、训练过程、模型的中间状态或模型决策的结果??
人工智能·python·深度学习·神经网络·机器学习·计算机视觉·cnn
LluckyYH9 小时前
代码随想录Day 46|动态规划完结,leetcode题目:647. 回文子串、516.最长回文子序列
数据结构·人工智能·算法·leetcode·动态规划
古猫先生9 小时前
YMTC Xtacking 4.0(Gen5)技术深度分析
服务器·人工智能·科技·云计算
一水鉴天10 小时前
智能工厂的软件设计 “程序program”表达式,即 接口模型的代理模式表达式
开发语言·人工智能·中间件·代理模式
Hiweir ·10 小时前
机器翻译之创建Seq2Seq的编码器、解码器
人工智能·pytorch·python·rnn·深度学习·算法·lstm
Element_南笙10 小时前
数据结构_1、基本概念
数据结构·人工智能