神经网络NLP基础 循环神经网络 LSTM

用的时候,只关心token的输入,以及hidden state就好了

sequence的length是多少,lstm的cell的数量就是多少

LSTM

BI-LSTM

stacked lstm

GRU

实现

相关推荐
fsnine15 小时前
深度学习——神经网络
人工智能·深度学习·神经网络
失散1317 小时前
自然语言处理——04 注意力机制
人工智能·自然语言处理·注意力机制·seq2seq 架构
%KT%18 小时前
简单聊聊多模态大语言模型MLLM
人工智能·语言模型·自然语言处理
Lntano__y21 小时前
详细分析大语言模型attention的计算复杂度,从数学角度分析
人工智能·语言模型·自然语言处理
失散131 天前
自然语言处理——03 RNN及其变体
人工智能·rnn·自然语言处理·gru·lstm
B612 little star king1 天前
UNIKGQA论文笔记
论文阅读·人工智能·笔记·自然语言处理·知识图谱
勤劳的进取家1 天前
论文阅读:Do As I Can, Not As I Say: Grounding Language in Robotic Affordances
论文阅读·人工智能·机器学习·语言模型·自然语言处理
THMAIL1 天前
大模型0基础开发入门与实践:第8章 “大力出奇迹”的哲学:大语言模型的核心技术揭秘
人工智能·语言模型·自然语言处理
算法_小学生1 天前
长短期记忆网络(LSTM)
人工智能·rnn·lstm
Virgil1391 天前
【TrOCR】模型预训练权重各个文件解读
人工智能·pytorch·计算机视觉·自然语言处理·ocr·transformer