Pytorch 对比TensorFlow 学习:Day 17-18: 循环神经网络(RNN)和LSTM

Day 17-18: 循环神经网络(RNN)和LSTM

在这两天的学习中,我专注于理解循环神经网络(RNN)和长短期记忆网络(LSTM)的基本概念,并学习了它们在处理序列数据时的应用。

1.RNN和LSTM基础:

RNN:了解了RNN是如何处理序列数据的,特别是它的循环结构可以用于处理时间序列或连续数据。

LSTM:学习了LSTM作为RNN的一种改进,它通过引入遗忘门、输入门和输出门解决了RNN的长期依赖问题。

2.实践应用:

使用这些概念来处理一个简单的序列数据任务,例如时间序列预测或文本数据处理。

构建一个包含RNN或LSTM层的神经网络模型。

3.PyTorch和TensorFlow实现:

在PyTorch中,使用nn.RNN或nn.LSTM来实现这些网络。

在TensorFlow中,使用Keras的SimpleRNN或LSTM层。

PyTorch代码示例:

import torch

import torch.nn as nn

import torch.optim as optim

class SimpleLSTM(nn.Module):#定义一个简单的LSTM模型

def init (self, input_size, hidden_size, num_classes):

super(SimpleLSTM, self).init ()

self.lstm = nn.LSTM(input_size, hidden_size, batch_first=True)

self.fc = nn.Linear(hidden_size, num_classes)

def forward(self, x):

初始隐藏状态和细胞状态

h0 = torch.zeros(1, x.size(0), hidden_size)

c0 = torch.zeros(1, x.size(0), hidden_size)

前向传播

out, _ = self.lstm(x, (h0, c0))

out = out[:, -1, :]

out = self.fc(out)

return out

#实例化模型、定义损失函数和优化器

input_size = 10 # 输入数据的特征维度

hidden_size = 20 # 隐藏层特征维度

num_classes = 2 # 输出类别数

model = SimpleLSTM(input_size, hidden_size, num_classes)

criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001)

TensorFlow代码示例

import tensorflow as tf

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import LSTM, Dense

#定义一个简单的LSTM模型

model = Sequential([

LSTM(20, input_shape=(None, 10)), # 输入序列的长度任意,特征维度为10

Dense(2, activation='softmax') # 假设是二分类问题

])

#编译模型

model.compile(optimizer='adam',

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

#模型概要

model.summary()

相关推荐
zhangrelay3 分钟前
面向机器人工程的 Linux 发行版:科学选型与深度评测-2026
笔记·学习
网络工程小王17 分钟前
【Function Calling详解】(学习笔记)
笔记·学习
新手小新23 分钟前
通信工程师学习笔记3-电信网间互联管理规定和网络安全法
网络·笔记·学习
red_redemption35 分钟前
自由学习记录(163)
学习
南無忘码至尊41 分钟前
Unity学习90天-第2天-认识键盘 / 鼠标输入(PC)并实现WASD 移动,鼠标控制物体转向
学习·unity·c#·游戏开发
sp_fyf_202444 分钟前
【大语言模型】OpenVLThinkerV2:面向多领域视觉任务的通用型多模态推理模型
人工智能·深度学习·学习·语言模型·transformer
被考核重击1 小时前
基础算法学习
学习·算法
creator_Li1 小时前
Kafka 全面技术笔记
笔记·学习·kafka
楼田莉子1 小时前
设计模式:构造器模式
开发语言·c++·后端·学习·设计模式
南境十里·墨染春水1 小时前
linux学习进展 进程
linux·运维·学习