神经网络NLP基础 循环神经网络 LSTM

用的时候,只关心token的输入,以及hidden state就好了

sequence的length是多少,lstm的cell的数量就是多少

LSTM

BI-LSTM

stacked lstm

GRU

实现

相关推荐
文火冰糖的硅基工坊2 小时前
[人工智能-大模型-122]:模型层 - RNN是通过神经元还是通过张量时间记录状态信息?时间状态信息是如何被更新的?
人工智能·rnn·深度学习
Chunyyyen4 小时前
【第二十周】自然语言处理的学习笔记05
笔记·学习·自然语言处理
亚里随笔4 小时前
AsyPPO_ 轻量级mini-critics如何提升大语言模型推理能力
人工智能·语言模型·自然语言处理·llm·agentic
Brianna Home6 小时前
大模型如何变身金融风控专家
人工智能·深度学习·机器学习·自然语言处理·stable diffusion·1024程序员节
HPC_C6 小时前
Efficient Memory Management for Large Language Model with PagedAttention
人工智能·语言模型·自然语言处理
rengang668 小时前
09-神经网络的结构:描述神经网络的层次化组成和设计
人工智能·深度学习·神经网络
rengang668 小时前
07-神经元模型:介绍神经网络中神经元的结构和功能
人工智能·深度学习·神经网络
亚里随笔12 小时前
ReSpec:突破RL训练瓶颈的推测解码优化系统
人工智能·深度学习·自然语言处理·大语言模型·rlhf
无风听海14 小时前
神经网络之PPMI矩阵
人工智能·神经网络·矩阵
IT古董15 小时前
【第七章:时间序列模型】2.时间序列统计模型与神经网络模型-(2)适用广泛的时间序列模型:Arima模型
人工智能·深度学习·神经网络