技术栈
gru
王_teacher
4 天前
人工智能
·
gru
·
llm
·
nlp
GRU (Gated Recurrent Unit,门控循环单元) 原理详解 并且手写GRU模型
GRU (Gated Recurrent Unit,门控循环单元) 是一种改进的循环神经网络(RNN),旨在解决传统 RNN 的梯度消失问题,并简化 LSTM 的复杂结构。
张二娃同学
4 天前
人工智能
·
python
·
rnn
·
深度学习
·
神经网络
·
gru
·
lstm
第08篇_RNN_LSTM_GRU序列模型
深度学习入门专栏 · 第 8 篇 适合读者:已经阅读前两篇内容,希望继续系统学习深度学习核心方法与实践流程的初学者
沪漂阿龙
6 天前
人工智能
·
rnn
·
深度学习
·
gru
·
lstm
面试题:循环神经网络(RNN)是什么?词嵌入、时序建模、梯度消失、LSTM/GRU 一文讲透
很多人背过一句话:RNN 是“适合序列数据的神经网络”。这句话没错,但面试里只答到这里,通常不够。真正能拉开差距的,是你能不能把这几个问题讲顺:什么是词嵌入?RNN 和前馈神经网络到底差在哪?为什么普通 RNN 容易梯度消失?工程上为什么大家更爱用 LSTM、GRU?
沪漂阿龙
6 天前
人工智能
·
rnn
·
深度学习
·
gru
·
lstm
面试题:传统序列模型详解——RNN、LSTM、GRU 原理、区别、优缺点一文讲透
1. 为什么面试官总爱问“传统序列模型”?1.1 这道题考察的到底是什么在 Transformer 爆火之前,RNN、LSTM、GRU 曾经长期是自然语言处理、语音识别、时间序列建模里的核心模型。即便今天很多生产场景已经把主力换成了 Transformer,这几个模型依然是理解“序列建模思想”的基础课。
zhoupenghui168
7 天前
人工智能
·
pytorch
·
python
·
gru
·
cuda
如何设置PyTorch程序在 GPU上运行
nvidia-smi命令:显示的是驱动支持的最高 CUDA 版本,而不是必须安装的版本Mac (M系列: M1/M2/M3芯片): 无需此步骤,直接安装 PyTorch 即可支持 MPS, 命令(无需 CUDA)如下:
FelixZhang028
8 天前
人工智能
·
深度学习
·
机器学习
·
gru
·
lstm
·
边缘计算
·
boosting
工业时序工况识别项目复盘:从深度学习探索到 LightGBM/CatBoost 落地
在工业智能化项目中,很多问题表面上看是一个“模型选择”问题,但真正做下来之后会发现,它往往是一个由数据质量、业务逻辑、模型能力、可解释性和工程落地共同决定的综合问题。
机器学习之心
11 天前
深度学习
·
matlab
·
gru
·
门控循环单元
·
锂电池健康状态估计
电池SOH估计和RUL预测,基于GRU门控循环单元的锂电池健康状态估计和剩余寿命预测,MATLAB代码
锂离子电池在循环使用过程中容量逐渐衰退,实时、准确地**估计健康状态(SOH)并预测剩余使用寿命(RUL)是保障电池系统安全、优化运维决策的关键。数据驱动方法利用充放电过程中可测的电压、电流、温度等参数,挖掘与容量衰减相关的间接特征,结合深度学习模型实现SOH回归预测,进而通过失效阈值推算RUL。本代码基于NASA锂电池数据集,采用门控循环单元(GRU)**构建SOH预测模型,并以此为基础实现RUL计算。
kishu_iOS&AI
20 天前
人工智能
·
pytorch
·
深度学习
·
自然语言处理
·
gru
·
lstm
NLP —— LSTM/GRU模型
LSTM(Long Short-Term Memory)也称长短时记忆结构, 它是传统RNN的变体, 与经典RNN相比能够有效捕捉长序列之间的语义关联, 缓解梯度消失或爆炸现象,处理长序列数据效果差的问题。同时LSTM的结构更复杂
一只独角兽
23 天前
自然语言处理
·
gru
·
transformer
·
vllm
DeepSeek-V4-Pro 部署实战指南:H100/H200/B200/B300/GB200/GB300 全硬件配置详解
来源: recipes.vllm.ai 官方配置DeepSeek-V4-Pro 是 DeepSeek V4 预览系列的旗舰模型,拥有 1.6T 总参数 / 49B 激活参数 的 MoE 架构,checkpoint 高达 960GB。本文基于 vLLM 官方 Recipes 配置,详细介绍六种主流 GPU 平台的部署方案。
EnCi Zheng
1 个月前
rnn
·
gru
·
lstm
01c-LSTM与GRU门控机制详解
本文深入讲解 LSTM(长短期记忆网络)和 GRU(门控循环单元)的门控机制原理。😊 我们将从传统 RNN 的梯度消失问题出发,详细剖析 LSTM 的三个门(遗忘门、输入门、输出门)和 GRU 的两个门(更新门、重置门)的工作机制,并通过数学公式和直观类比帮助你理解这些"门"如何控制信息流。掌握门控机制是理解现代序列模型的关键一步!
Takoony
1 个月前
算法
·
gru
GPU 推理并发的本质:从第一性原理到工程实践
一切优化的起点,是两个硬件事实:事实 1:搬运比计算慢。以 A100 为例:显存带宽 2TB/s,算力峰值 312 TFLOPS(FP16)。一个 7B 模型的权重约 14GB,单次加载耗时 7ms,但这 14GB 权重理论上可以完成的浮点运算远超 7ms 内 GPU 能"搬完"的量。结论:推理的瓶颈不是算不过来,而是搬不过来。
机器学习之心
1 个月前
深度学习
·
gru
·
transformer
·
门控循环单元
·
编码器
·
二次分解
CEEMDAN-VMD-Transformer-GRU二次分解+编码器+门控循环单元多元时间序列预测
实际工程与科学数据(如振动信号、电力负荷、金融时序)常呈现非线性、非平稳特征,单一预测模型难以充分提取多尺度信息。为此,结合自适应信号分解(CEEMDAN、VMD)与深度学习(Transformer、GRU)成为提升预测精度的有效手段。本代码实现了一套“分解-聚类-再分解-分量预测-重构”的完整流程,旨在提高复杂时间序列的预测性能。
机器学习之心
2 个月前
python
·
gru
·
lstm
·
强化学习
·
动态权重组合方法
强化学习驱动的光伏功率时间序列预测:LSTM与GRU动态权重组合方法Python
时间序列预测在能源、金融、气象等领域具有广泛应用。单一预测模型往往难以适应数据中复杂的时序模式,而模型组合(Ensemble)通过融合多个基模型的预测结果,通常能获得更优的泛化性能。传统的组合方法多采用固定权重或基于验证集性能的静态加权,难以适应数据分布的动态变化。
机器学习之心
2 个月前
深度学习
·
matlab
·
双向门控循环单元
·
gru
·
bigru
·
车速预测
多工况车速数据集训练BiGRU双向门控循环单元用于车速预测,输出未来多个时间步车速,MATLAB代码
基于双向门控循环单元(BiGRU)的车速预测模型,主要面向汽车行驶工况的时间序列预测任务车速预测在智能交通系统、混合动力汽车能量管理、驾驶辅助系统等领域具有重要意义。通过历史车速序列预测未来车速,可为车辆控制策略提供关键输入,从而提升燃油经济性、降低排放、优化驾驶体验。
机器学习之心
2 个月前
python
·
深度学习
·
gru
基于GRU与Informer混合架构的时间序列预测,主要用于处理多变量时间序列的短期预测任务,已更新到Python机器学习/深度学习程序全家桶
代码实现了一个基于GRU与Informer混合架构的时间序列预测,主要用于处理多变量时间序列的短期预测任务。
机器学习之心
2 个月前
gru
·
lstm
·
bilstm
·
bigru
·
nasa数据集
·
四模型锂电池剩余寿命预测对比
四模型锂电池剩余寿命预测对比(LSTM、BiLSTM、GRU、BiGRU),NASA数据集,MATLAB代码
锂离子电池在长期充放电循环中容量会逐渐衰减,当容量低于某一阈值时即认为寿命终止(EOL)。准确预测电池剩余寿命(RUL)对保障设备安全运行、优化维护策略具有重要意义。本代码以电池容量数据为基础,对比四种深度学习模型在容量预测及剩余寿命估计中的表现。
机器学习之心
2 个月前
深度学习
·
matlab
·
gru
·
车速预测
多工况车速数据集训练GRU门控循环单元用于车速预测,输出未来多个时间步车速,MATLAB代码
车速预测是智能交通系统和新能源汽车能量管理的关键技术之一。准确预测未来短时车速有助于优化车辆控制策略(如混合动力汽车的功率分配、电动汽车的续航估计),提高整车经济性与安全性。标准驾驶循环(如NEDC、UDDS、WLTC)常用于验证预测算法的有效性,因此本代码利用多个公开工况数据训练GRU模型,并在目标工况上进行预测与评估。
Flying pigs~~
2 个月前
人工智能
·
rnn
·
深度学习
·
gru
·
nlp
·
lstm
·
循环神经网络
深入浅出RNN及其变体:从传统RNN到LSTM、GRU
循环神经网络(Recurrent Neural Network, RNN) 是一类以序列数据为输入的神经网络。它通过网络内部的结构设计,能够有效捕捉序列数据之间的前后关联特征,输出通常也是序列形式。
机器学习之心
2 个月前
python
·
gru
·
lstm
利用强化学习动态调整LSTM与GRU集成权重:完整Python实现
在时间序列预测中,集成学习常通过固定权重组合多个模型,但静态权重无法适应数据动态变化。本文将带你用强化学习(REINFORCE)动态调整LSTM和GRU的集成权重,实现自适应预测。代码包含数据预处理、模型训练、强化学习优化、评估及5种专业图表,可直接运行。
机器学习之心
2 个月前
matlab
·
cnn
·
gru
·
故障诊断
·
cwt-cnn-gru
CWT-CNN-GRU基于连续小波变换和卷积神经网络-门控循环单元故障诊断MATLAB代码
该代码实现了一个基于连续小波变换(CWT)和卷积神经网络-门控循环单元(CNN-GRU)的滚动轴承故障诊断系统。以下从研究背景、主要功能、算法步骤、技术路线、公式原理、参数设定、运行环境和应用场景八个方面进行简述。