技术栈
rnn
CCPC不拿奖不改名
1 天前
人工智能
·
python
·
rnn
·
深度学习
·
神经网络
·
自然语言处理
·
embedding
循环神经网络RNN:整数索引→稠密向量(嵌入层 / Embedding)详解
整数索引(如[4,5,6,7])虽然是数值,但存在两个致命问题,无法直接输入 RNN:离散且无语义:索引的数值大小无意义(如索引 7>4 不代表 “苹果” 比 “我” 重要),也无法体现 Token 间的语义关联(如 “苹果” 和 “香蕉” 的索引无任何关联);
JeffDingAI
1 天前
笔记
·
rnn
·
学习
【Datawhale学习笔记】动手学RNN及LSTM
为了与后续的代码实现保持一致,此处采用一个不含偏置项(bias)的简化版 RNN,核心计算公式如下:h t = tanh ( U x t + W h t − 1 ) h_t = \tanh(U x_t + W h_{t-1}) ht=tanh(Uxt+Wht−1)
CCPC不拿奖不改名
1 天前
人工智能
·
python
·
rnn
·
神经网络
·
自然语言处理
·
token
·
josn
“Token→整数索引” 的完整实现步骤
这一步的核心是构建词汇表(Vocabulary/Vocab),再通过词汇表完成 Token 到索引的映射。整个流程分为 4 步,我们结合具体文本例子讲解。
2301_80025611
4 天前
人工智能
·
rnn
·
深度学习
【人工智能引论期末复习】 第6章 深度学习4 - RNN
RNN全称:循环神经网络(Recurrent Neural Network)RNN的主要特点:具有记忆能力,能处理序列数据
qwerasda123852
5 天前
人工智能
·
rnn
·
安全
基于改进的SABL Cascade RNN的安全装备检测系统:手套护目镜安全帽防护服安全鞋识别与实现_r101_fpn_1x_coco_1
worker_safety数据集是一个专注于工人安全装备检测的计算机视觉数据集,该数据集于2024年10月8日创建,采用CC BY 4.0许可证授权。数据集包含1749张图像,所有图像均已进行预处理,包括自动调整像素数据方向(剥离EXIF方向信息)和拉伸至640×640像素尺寸。数据集采用YOLOv8格式进行标注,共包含5个类别:手套(gloves)、护目镜(googles)、安全帽(hardhat)、防护服(jacket)和安全鞋(shoes)。数据集分为训练集、验证集和测试集三部分,适用于目标检测模型
All The Way North-
6 天前
rnn
·
深度学习
·
nlp
·
循环神经网络
·
时间序列
RNN基本介绍
循环神经网络(RNN)入门介绍循环神经网络(Recurrent Neural Network,简称 RNN)是一类专门用于处理序列数据的神经网络。与传统的前馈神经网络(Feedforward Neural Network)不同,RNN 具有“记忆”能力,可以利用之前的信息来影响当前的输出。
一瞬祈望
6 天前
rnn
·
深度学习
·
lstm
⭐ 深度学习入门体系(第 15 篇): 从 RNN 到 LSTM:为什么深度网络需要“记忆能力”?
卷积网络(CNN)擅长处理图片, Transformer 擅长处理大规模序列, 但在它们崛起之前,序列建模的老大哥其实是 RNN/LSTM。
Hcoco_me
8 天前
人工智能
·
rnn
·
深度学习
RNN(循环神经网络)
在 Word2Vec 部分我们聊过,Word2Vec 是“词袋思想”,完全忽略词的顺序——“我 爱 吃 苹果”和“苹果 吃 爱 我”的 Word2Vec 向量组合没有区别,这显然不符合语言逻辑。
墨北小七
8 天前
人工智能
·
rnn
·
lstm
从记忆到创作:LSTM如何赋能智能小说生成
> **摘要**:本文将深入探讨LSTM在小说创作领域的创新应用,从原理解析到实战代码,为您展示如何利用这一强大的时序模型开启AI写作新时代。
岁月的眸
10 天前
rnn
·
gru
·
lstm
【基于循环神经网络(RNN/LSTM/GRU)算法做电池剩余寿命的思路和代码示例】
下面给你一个**“基于循环神经网络(RNN/LSTM/GRU)做电池剩余寿命(RUL)预测”的可直接跑的代码示例**(PyTorch 版),包含:数据→滑动窗口→RNN 模型→训练→评估→推理。你把自己的电池序列特征(电压/电流/温度/容量等)塞进去就能用。
Hcoco_me
12 天前
人工智能
·
rnn
·
深度学习
·
lstm
·
transformer
大模型面试题42:从小白视角递进讲解大模型训练的重计算
重计算是大模型训练的核心内存优化技术,本质是以时间换空间的策略。我们从「为什么需要它」到「核心特性」再到「进阶玩法」,一步步讲清楚。
retrofit
12 天前
pytorch
·
rnn
·
深度学习
·
循环神经网络
基于PyTorch的深度学习基础课程之十三:循环神经网络
循环神经网络(RNN)是一种用于处理序列数据的深度学习模型,通过隐层状态的反馈机制实现对序列特征的记忆和学习。RNN可应用于序列回归、分类和标注任务,如股价预测、文本分类等场景,其核心优势在于能够捕捉序列数据中的时序依赖关系。本文详细讨论了RNN的基本结构以及LSTM的结构,以及如何使用它们来构建循环神经网络,并给出了简要的应用示例。RNN也是理解目前应用最为广泛的Transformer模型(下文将讨论)的基础。
MarkHD
13 天前
人工智能
·
rnn
·
lstm
智能体在车联网中的应用:第41天 车联网轨迹预测核心技术:从Social-LSTM到VectorNet的演进与深度解析
在自动驾驶与车联网(V2X)构成的复杂交通生态中,准确预测周边车辆、行人等交通参与者的未来轨迹,是确保行车安全、实现高效协同决策的基石。轨迹预测不仅需要理解单个目标的运动规律,更需要建模目标之间以及目标与环境之间的复杂交互。这是一个典型的时空序列预测问题,充满了不确定性和动态性。
声声codeGrandMaster
13 天前
人工智能
·
rnn
·
深度学习
RNN模型文本训练与推理
这一篇文章, 就是对上一篇文章内容进行补充, 上一次我们还遗留着模型训练与文本推理的内容, 我们在这一篇文章里面都会讲到。
sensen_kiss
14 天前
人工智能
·
rnn
·
机器学习
INT305 Machine Learning 机器学习 Pt.11 循环神经网络(RNN,Recurrent Neural Network)
我们之前提到过神经网络,而且别的课程中也对神经网络进行了系统的学习。 我们再回顾一下一些著名的神经网络模型。
果粒蹬i
14 天前
rnn
·
matlab
·
lstm
MATLAB全流程对比RNN/LSTM/GRU时间序列预测性能
在大数据与人工智能时代,时间序列预测已成为金融风控、能源调度、气象预报等领域的核心技术支撑。从股票价格波动到电力负荷峰值预测,从气温变化趋势到设备故障预警,精准的时间序列预测能为决策提供关键依据。而在众多预测模型中,循环神经网络(RNN)及其改进模型长短期记忆网络(LSTM)、门控循环单元(GRU)凭借对时序依赖关系的捕捉能力,成为该领域的主流选择。 但问题来了:同样是处理时间序列数据,RNN、LSTM、GRU到底该怎么选?它们的预测精度、训练效率、适用场景有何差异?不少开发者和研究者在实际项目中都会陷入
Hcoco_me
15 天前
人工智能
·
rnn
·
深度学习
·
自然语言处理
·
lstm
·
transformer
·
word2vec
大模型面试题36:Transformer中的残差连接处理方式与作用
我们用 “抄近路保留原始信息” 的生活化比喻讲透核心逻辑,再逐步拆解它在Transformer中的具体处理流程、数学原理和关键作用。
Hcoco_me
15 天前
人工智能
·
rnn
·
深度学习
·
自然语言处理
·
word2vec
大模型面试题29:稀疏注意力是什么?
想象你在一个有10000人的大派对上,你需要和每个人握手、聊天,才能了解整个派对的情况。 这就像 Transformer 的原始注意力机制:
Hcoco_me
15 天前
人工智能
·
rnn
·
深度学习
·
lstm
·
word2vec
大模型面试题30:Padding 的 mask 操作
想象你在学校交作业,老师要求每个人都交 5 页纸。在深度学习里:回到交作业的例子:在模型里:mask 操作就像给老师一个**“忽略清单”**:
Hcoco_me
15 天前
人工智能
·
rnn
·
深度学习
·
自然语言处理
·
transformer
·
word2vec
大模型面试题33:Transformer为什么用LayerNorm,而非BatchNorm?
我们先从 “归一化的目标”和“数据的特点” 两个生活化角度讲透核心区别,再逐步深入技术细节,结合Transformer的场景分析原因。