rnn

z小猫不吃鱼3 天前
人工智能·rnn·transformer
02 从 RNN 到 Transformer:为什么语言建模需要新结构?在上一篇文章中,我们从整体上介绍了大语言模型的发展路线。大语言模型并不是突然出现的,它背后经历了一个长期演进过程:
YUDAMENGNIUBI4 天前
人工智能·rnn·深度学习
day31_RNN及其变体循环神经网络RNN(Recurrent Neural Network),专门以序列数据为输入,通过网络内部结构设计有效捕捉序列之间的关系特征,一般以序列形式进行输出。
Yunzenn4 天前
人工智能·rnn·深度学习·神经网络·生成对抗网络·架构·transformer
深度分析字节最新研究cola-DLM第 06 章:分块因果 DiT 先验 —— 在隐空间里做 Flow Matching论文:Continuous Latent Diffusion Language Model 项目地址:ByteDance-Seed/Cola-DLM 源码:modeling_cola_dit.py
MediaTea5 天前
人工智能·rnn·深度学习·神经网络·lstm
AI 术语通俗词典:LSTMLSTM 是深度学习、循环神经网络、自然语言处理、时间序列预测和人工智能模型训练中非常经典的一个术语,全称是 Long Short-Term Memory,通常翻译为“长短期记忆网络”。它用来描述一种能够在序列数据中保留较长时间依赖关系的神经网络结构。换句话说,LSTM 是在回答:模型怎样在处理一串连续数据时,既记住前面重要信息,又忘掉不重要信息。
MediaTea5 天前
人工智能·rnn·深度学习·gru
AI 术语通俗词典:GRUGRU 是深度学习、循环神经网络、自然语言处理、时间序列预测和人工智能序列建模中常见的一个术语,全称是 Gated Recurrent Unit,通常翻译为“门控循环单元”。它用来描述一种通过门控机制处理序列数据的循环神经网络结构。换句话说,GRU 是在回答:模型怎样在按顺序读取数据时,既保留有用历史信息,又用较简洁的结构控制记忆更新。
kcuwu.6 天前
rnn·gru·lstm
RNN、LSTM、GRU技术博客面向初学者的循环神经网络详解,从参数维度到代码实战,一篇文章彻底搞懂!在深度学习领域,处理序列数据(如文本、语音、时间序列)是一个非常重要的任务。传统的前馈神经网络无法很好地处理序列中的依赖关系,而 ** 循环神经网络(Recurrent Neural Network, RNN)** 及其变体 LSTM、GRU 应运而生,成为处理序列数据的利器。
MediaTea6 天前
人工智能·pytorch·rnn·深度学习·神经网络
DL:循环神经网络的基本原理与 PyTorch 实现循环神经网络(Recurrent Neural Network,RNN)是深度学习中专门用于处理序列数据的一类神经网络。与前馈神经网络不同,RNN 不只是把输入从前向后逐层传递,而是在处理序列时引入“隐藏状态”,让模型能够把前面时间步的信息传递到后面时间步。
ZHW_AI课题组7 天前
人工智能·rnn·lstm
基于LSTM的天气预测作者介绍陈相樵,男,西安工程大学电子信息学院,2025级研究生,张宏伟人工智能课题组研究方向:无人机路径规划
啦啦啦_99997 天前
人工智能·rnn·深度学习
RNN 入门RNN有三层: 池嵌入层:语料库,词表,词表索引,词向量(程序无法分析文字与文字之间的关系,如 中 字后可跟很多词,程序无法分析文字,所以要把文字转换成一个词,词向量,用几个数值代表词,来分析数值之间的关系,这是词嵌入层做的操作 把词转成词向量;)
风落无尘8 天前
gpt·rnn·语言模型·transformer
第九章《语言与理解》 完整学习资料本资料为《智能重生:从垃圾堆到AI工程师》第九章的配套学习内容。 阅读小说原文:第九章《语言与理解》 专栏总目录:《智能重生》AI工程师成长小说专栏
初心未改HD8 天前
人工智能·rnn·深度学习
深度学习之RNN循环神经网络详解循环神经网络(Recurrent Neural Network,RNN)是一类专门用于处理序列数据的神经网络模型。与传统的前馈神经网络不同,RNN 通过引入隐藏状态(Hidden State)在时间步之间传递信息,从而能够有效捕捉序列中的时序依赖关系。本文系统介绍了RNN的核心原理、网络结构、前向传播与反向传播算法,并深入分析了梯度消失与梯度爆炸等经典难题。随后梳理了RNN的多种类型及其在自然语言处理、时间序列预测、语音识别等领域的典型应用场景。最后,通过 PyTorch 框架提供了四个完整的代码实战案例
Yunzenn8 天前
linux·人工智能·rnn·深度学习·机器学习·架构·transformer
深度分析字节最新研究cola-DLM第 01 章:语言生成的三次范式之争 —— 从 RNN 到 AR 到扩散论文:Continuous Latent Diffusion Language Model项目地址:ByteDance-Seed/Cola-DLM
郑同学zxc9 天前
人工智能·rnn·机器学习
机器学习20-RNNImageNet 是计算机视觉领域的“奠基性数据集”,由斯坦福大学李飞飞教授团队发起构建,是推动深度学习在视觉领域爆发的核心“燃料”。它不仅是一个大规模图像库,更重新定义了 AI 视觉技术的发展路径,直接催生了 AlexNet、ResNet 等经典模型,开启了现代深度学习时代。
陈天伟教授10 天前
人工智能·rnn·深度学习
图解人工智能(28)循环神经网络是如何实现记忆功能讨论一下,循环神经网络是如何实现记忆功能的?为什么说这种记忆功能对成串的数据特别重要?循环神经网络是通过循环连接实现记忆功能的。循环连接的存在意味着当前状态会传递到下一个状态,这样从前到后的传递过程就形成了对历史信息的记忆。
YUDAMENGNIUBI10 天前
人工智能·rnn·cnn
day27_卷积神经网络与循环神经网络入门在正式聊CNN之前,先来看一眼我们处理的对象——图像。图像是由密密麻麻的像素点组成的,每个像素点的取值范围是 [0, 255]。像素值越接近0,颜色越暗(接近黑色);越接近255,颜色越亮(接近白色)。
kcuwu.11 天前
人工智能·rnn·cnn
CNN与RNN入门技术博客在深度学习的世界里,有两大神经网络架构堪称基石——卷积神经网络 (CNN)和循环神经网络 (RNN)。它们分别统治着计算机视觉和自然语言处理两大领域,是每一位 AI 入门者必须掌握的核心技术。
张二娃同学15 天前
人工智能·python·rnn·深度学习·神经网络·gru·lstm
第08篇_RNN_LSTM_GRU序列模型深度学习入门专栏 · 第 8 篇 适合读者:已经阅读前两篇内容,希望继续系统学习深度学习核心方法与实践流程的初学者
Jmayday16 天前
人工智能·rnn·深度学习·nlp
RNN案例之:人名分类器目录一、需求分析二、整体步骤三、代码实现四、模型预测五、总结1、背景关于人名分类问题:以一个人名为输入, 使用模型帮助我们判断它最有可能是来自哪一个国家的人名, 这在某些国际化公司的业务中具有重要意义, 在用户注册过程中, 会根据用户填写的名字直接给他分配可能的国家或地区选项, 以及该国家或地区的国旗, 限制手机号码位数等等.
沪漂阿龙16 天前
人工智能·rnn·深度学习·gru·lstm
面试题:循环神经网络(RNN)是什么?词嵌入、时序建模、梯度消失、LSTM/GRU 一文讲透很多人背过一句话:RNN 是“适合序列数据的神经网络”。这句话没错,但面试里只答到这里,通常不够。真正能拉开差距的,是你能不能把这几个问题讲顺:什么是词嵌入?RNN 和前馈神经网络到底差在哪?为什么普通 RNN 容易梯度消失?工程上为什么大家更爱用 LSTM、GRU?
沪漂阿龙16 天前
人工智能·rnn·深度学习·gru·lstm
面试题:传统序列模型详解——RNN、LSTM、GRU 原理、区别、优缺点一文讲透1. 为什么面试官总爱问“传统序列模型”?1.1 这道题考察的到底是什么在 Transformer 爆火之前,RNN、LSTM、GRU 曾经长期是自然语言处理、语音识别、时间序列建模里的核心模型。即便今天很多生产场景已经把主力换成了 Transformer,这几个模型依然是理解“序列建模思想”的基础课。