Pytorch 对比TensorFlow 学习:Day 17-18: 循环神经网络(RNN)和LSTM

Day 17-18: 循环神经网络(RNN)和LSTM

在这两天的学习中,我专注于理解循环神经网络(RNN)和长短期记忆网络(LSTM)的基本概念,并学习了它们在处理序列数据时的应用。

1.RNN和LSTM基础:

RNN:了解了RNN是如何处理序列数据的,特别是它的循环结构可以用于处理时间序列或连续数据。

LSTM:学习了LSTM作为RNN的一种改进,它通过引入遗忘门、输入门和输出门解决了RNN的长期依赖问题。

2.实践应用:

使用这些概念来处理一个简单的序列数据任务,例如时间序列预测或文本数据处理。

构建一个包含RNN或LSTM层的神经网络模型。

3.PyTorch和TensorFlow实现:

在PyTorch中,使用nn.RNN或nn.LSTM来实现这些网络。

在TensorFlow中,使用Keras的SimpleRNN或LSTM层。

PyTorch代码示例:

import torch

import torch.nn as nn

import torch.optim as optim

class SimpleLSTM(nn.Module):#定义一个简单的LSTM模型

def init (self, input_size, hidden_size, num_classes):

super(SimpleLSTM, self).init ()

self.lstm = nn.LSTM(input_size, hidden_size, batch_first=True)

self.fc = nn.Linear(hidden_size, num_classes)

def forward(self, x):

初始隐藏状态和细胞状态

h0 = torch.zeros(1, x.size(0), hidden_size)

c0 = torch.zeros(1, x.size(0), hidden_size)

前向传播

out, _ = self.lstm(x, (h0, c0))

out = out[:, -1, :]

out = self.fc(out)

return out

#实例化模型、定义损失函数和优化器

input_size = 10 # 输入数据的特征维度

hidden_size = 20 # 隐藏层特征维度

num_classes = 2 # 输出类别数

model = SimpleLSTM(input_size, hidden_size, num_classes)

criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(model.parameters(), lr=0.001)

TensorFlow代码示例

import tensorflow as tf

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import LSTM, Dense

#定义一个简单的LSTM模型

model = Sequential([

LSTM(20, input_shape=(None, 10)), # 输入序列的长度任意,特征维度为10

Dense(2, activation='softmax') # 假设是二分类问题

])

#编译模型

model.compile(optimizer='adam',

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

#模型概要

model.summary()

相关推荐
落羽凉笙37 分钟前
Python学习笔记(3)|数据类型、变量与运算符:夯实基础,从入门到避坑(附图解+代码)
笔记·python·学习
Quintus五等升42 分钟前
深度学习①|线性回归的实现
人工智能·python·深度学习·学习·机器学习·回归·线性回归
jz_ddk2 小时前
[学习] 卫星导航的码相位与载波相位计算
学习·算法·gps·gnss·北斗
小途软件2 小时前
高校宿舍访客预约管理平台开发
java·人工智能·pytorch·python·深度学习·语言模型
华清远见成都中心3 小时前
人工智能要学习的课程有哪些?
人工智能·学习
hssfscv3 小时前
Javaweb学习笔记——后端实战2_部门管理
java·笔记·学习
白帽子黑客罗哥3 小时前
不同就业方向(如AI、网络安全、前端开发)的具体学习路径和技能要求是什么?
人工智能·学习·web安全
于越海4 小时前
材料电子理论核心四个基本模型的python编程学习
开发语言·笔记·python·学习·学习方法
我命由我123454 小时前
开发中的英语积累 P26:Recursive、Parser、Pair、Matrix、Inset、Appropriate
经验分享·笔记·学习·职场和发展·求职招聘·职场发展·学习方法
北岛寒沫4 小时前
北京大学国家发展研究院 经济学原理课程笔记(第二十三课 货币供应与通货膨胀)
经验分享·笔记·学习