神经网络NLP基础 循环神经网络 LSTM

用的时候,只关心token的输入,以及hidden state就好了

sequence的length是多少,lstm的cell的数量就是多少

LSTM

BI-LSTM

stacked lstm

GRU

实现

相关推荐
等一个人的@16 小时前
让数据自己开口:数睿通智库新增智能问数模块
人工智能·自然语言处理
王莎莎-MinerU16 小时前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
Jmayday21 小时前
NLP第四章:Transformer架构
人工智能·自然语言处理·transformer
Hello world.Joey1 天前
吴恩达深度学习基础
人工智能·深度学习·神经网络·opencv·算法·机器学习·计算机视觉
星恒随风1 天前
从零开始理解 ResNet(上):为什么 CNN 需要“残差连接”?
人工智能·笔记·神经网络·学习·cnn
wabs6661 天前
本科毕业设计项目——基于RAG与大语言模型的408问答系统设计与实现【检索与生成功能的第三步答案生成是怎么实现的?】
人工智能·语言模型·自然语言处理
z小猫不吃鱼1 天前
07 GPT-1 论文精读:生成式预训练如何用于 NLP 任务?
人工智能·gpt·自然语言处理
有为少年1 天前
深度隐式层 | 深度平衡模型 (Deep Equilibrium, DEQ)
人工智能·深度学习·神经网络·机器学习
财经资讯数据_灵砚智能1 天前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月28日
大数据·人工智能·python·信息可视化·自然语言处理·ai编程·灵砚智能
学习中.........1 天前
大语言模型的推理机制与工程应用
人工智能·语言模型·自然语言处理