RNN 交叉熵

RNN善于处理时序 序列数据

简单RNN

展开就是

LSTM

遗忘门f_t决定上期记忆保留多少

隐藏层

在神经网络中,隐藏层指的是除了输入层和输出层之外的层,它们的输出不会直接用于网络的最终输出,而是作为中间步骤用于提取和转换数据。因此,如:卷积层作为一种在输入和输出之间的处理层,被归类为隐藏层。

隐状态

X_t符号含义

反向传播以求梯度 前向传播以求输出

信息论

信息熵

交叉熵损失函数

可以由信息熵推广而来,也可以通过极大似然的推导而来

softmax

然后选最大的,详见DL Softmax,多层感知机,卷积【0】_softmax与多层感知机的对比-CSDN博客

概率论

极大似然

数据集中,每个点的概率密度函数之积最小(即约≈p(X)),求导=0求参数,叫做参数的极大似然估计

相关推荐
路人与大师3 小时前
热门大型语言模型(LLM)应用开发框架
人工智能·语言模型·自然语言处理
_冷眸_8 小时前
SQLord: 基于反向数据生成和任务拆解的 Text-to-SQL 企业落地方案
人工智能·sql·自然语言处理·aigc·机器翻译
AI让世界更懂你11 小时前
【NLP基础知识系列课程-Tokenizer的前世今生第四课】生物信息中的 Tokenizer 策略:如何切开一段基因?
人工智能·自然语言处理
郜太素14 小时前
自然语言处理入门及文本预处理
人工智能·自然语言处理·nlp·tensorflow·word2vec
亿牛云爬虫专家14 小时前
NLP助力非结构化文本抽取:实体关系提取实战
人工智能·自然语言处理·nlp·爬虫代理·代理ip·微博·文本抽取
熵减画眉17 小时前
科技趋势分析系统(BBC)技术全解
人工智能·python·科技·机器学习·unity·自然语言处理·游戏引擎
AI让世界更懂你18 小时前
【NLP基础知识系列课程-Tokenizer的前世今生第三课】多模态世界中的 Tokenizer 策略
人工智能·自然语言处理
pen-ai18 小时前
【深度学习】9. CNN性能提升-轻量化模型专辑:SqueezeNet / MobileNet / ShuffleNet / EfficientNet
人工智能·深度学习·cnn
明似水18 小时前
AI时代新词-大模型(Large Language Model)
人工智能·语言模型·自然语言处理
yzx9910131 天前
RNN 在时序数据处理中的核心作用
人工智能·rnn·深度学习