神经网络NLP基础 循环神经网络 LSTM

用的时候,只关心token的输入,以及hidden state就好了

sequence的length是多少,lstm的cell的数量就是多少

LSTM

BI-LSTM

stacked lstm

GRU

实现

相关推荐
第七序章3 天前
【C++STL】list的详细用法和底层实现
c语言·c++·自然语言处理·list
大千AI助手3 天前
TruthfulQA:衡量语言模型真实性的基准
人工智能·语言模型·自然语言处理·llm·模型评估·truthfulqa·事实性基准
心动啊1213 天前
深度神经网络1——梯度问题+标签数不够问题
人工智能·神经网络·dnn
什么都想学的阿超3 天前
【大语言模型 58】分布式文件系统:训练数据高效存储
人工智能·语言模型·自然语言处理
ViperL13 天前
[智能算法]可微的神经网络搜索算法-FBNet
人工智能·深度学习·神经网络
金井PRATHAMA3 天前
认知语义学隐喻理论对人工智能自然语言处理中深层语义分析的赋能与挑战
人工智能·自然语言处理·知识图谱
J_Xiong01173 天前
【VLMs篇】07:Open-Qwen2VL:在学术资源上对完全开放的多模态大语言模型进行计算高效的预训练
人工智能·语言模型·自然语言处理
苏苏susuus3 天前
NLP:Transformer之self-attention(特别分享3)
人工智能·自然语言处理·transformer
这张生成的图像能检测吗4 天前
(综述)视觉任务的视觉语言模型
人工智能·计算机视觉·语言模型·自然语言处理·视觉语言模型
Hcoco_me4 天前
深度学习和神经网络之间有什么区别?
人工智能·深度学习·神经网络