神经网络NLP基础 循环神经网络 LSTM

用的时候,只关心token的输入,以及hidden state就好了

sequence的length是多少,lstm的cell的数量就是多少

LSTM

BI-LSTM

stacked lstm

GRU

实现

相关推荐
KG_LLM图谱增强大模型4 小时前
MedHELM:真实临床医疗任务大语言模型的整体评估框架
人工智能·语言模型·自然语言处理
咚咚王者4 小时前
人工智能之语言领域 自然语言处理 第十九章 深度学习框架
人工智能·深度学习·自然语言处理
吴佳浩 Alben4 小时前
GPU 编号错乱踩坑指南:PyTorch cuda 编号与 nvidia-smi 不一致
人工智能·pytorch·python·深度学习·神经网络·语言模型·自然语言处理
Echo_NGC22375 小时前
【卷积神经网络 CNN】一文讲透卷积神经网络CNN的核心概念与演进历程
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·cnn
大模型任我行5 小时前
腾讯:揭示评估幻觉并构建知识驱动新范式
人工智能·语言模型·自然语言处理·论文笔记
LaughingZhu6 小时前
Product Hunt 每日热榜 | 2026-03-21
人工智能·经验分享·深度学习·神经网络·产品运营
轮到我狗叫了6 小时前
GAN初次阅读
人工智能·神经网络·生成对抗网络
造夢先森6 小时前
【白话神经网络(三)】从Transformer到XXX
人工智能·神经网络·transformer
剑穗挂着新流苏3127 小时前
111_神经网络的指路明灯:损失函数与反向传播深度解析
人工智能·深度学习·神经网络
永霖光电_UVLED8 小时前
Hensoldt 与 UMS 签署 GaN 供应协议
人工智能·神经网络·生成对抗网络