2022最新版-李宏毅机器学习深度学习课程-P26RNN-2

QwQllly2023-10-20 17:41

一、RNN网络结构

与时间有关的反向传播（每次不同）

损失函数

实验其实不容易跑，因为他的损失函数曲线幅度很大

画出来差不多是这个样子。突然一下升高是因为从右到左碰到陡峭的地方梯度一下变大了，所以弹回去了。

原作者在训练时加上了小技巧------clipping：设置一个峰值，若超过则等于该峰值。

梯度大的原因：

当W>1时，微小的变化会引起很大的变化；
当w<1时，较大的变化带来的变化也很小。

RNN一些有用的变形

LSTM以及简化为双门的GRU

Clockwise RNN && SCRN

多对一

多长对多短

这里是最后删去重复的字符

改加上null符号后，可以实现一些叠词

CTC方法

多对多（无限制）

加上一个断的符号，可以及时终止

可以用在机器学习上

语法分析

自动编码器

可以提高传输效率和节约成本

上一篇：从入门到进阶之 ElasticSearch SpringData 继承篇

下一篇：23.项目开发之量化交易抓取数据QuantTradeData(二)

热门推荐

01UV安装并设置国内源 02DeepSeek更新！速览DeepSeek V3.1新特性 03Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 04KGG转MP3工具|非KGM文件|解密音频 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 06【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）072025最新国内服务器可用docker源仓库地址大全（2025年8月更新）08阿里开源首个图像生成基础模型——Qwen-Image本地部署教程，超强中文渲染能力刷新SOTA！09NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 10TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践