机器学习入门(十一)常见的神经网络汇总

上一篇文章介绍了 RNN,这一篇文章将介绍一下其他常见的神经网络。

循环神经网络(RNN)

循环神经网络(RNN),用于处理序列数据 。与传统的神经网络不同,RNN具有循环连接,使得它可以在处理序列时保持一种记忆状态。图片来源这里

如上图所示,RNN 的隐藏层会把当前时间步的输入和上一个时间步的隐藏状态作为输入。通过这种循环,使得RNN可以处理变长序列,并且能够捕捉到序列中的时序信息。

长短时记忆网络(LSTM)

传统的RNN在处理长序列时存在梯度消失和梯度爆炸的问题,这限制了其对长期依赖关系的建模能力。为了解决这个问题,出现了长短时记忆网络(LSTM),它是一种改进的循环神经网络(RNN)架构。

LSTM 引入了一个记忆单元(memory cell),该单元可以存储和访问信息,并通过门控机制来控制信息的流动。LSTM 的关键部分包括输入门 (input gate)、遗忘门 (forget gate)、输出门 (output gate)。如下图所示,图片来源这里

生成对抗网络(GAN)

GAN包含有两个模型,一个是生成模型(generative model),一个是判别模型(discriminative model)。生成模型的任务是生成看起来自然真实的、和原始数据相似的实例。判别模型的任务是判断给定的实例看起来是自然真实的还是人为伪造的(真实实例来源于数据集,伪造实例来源于生成模型)。二者关系形成对抗,因此叫对抗网络。

模型的保存和加载

之前介绍过,我们可以使用 keras 库来训练对应的神经网络模型。这里介绍一下,如何保存和加载已经训练好的模型。代码示例如下:

ini 复制代码
# 存储模型
import joblib
joblib.dump(model1, 'model1.m')
# 模型加载
model2 = joblib.load('model1.m')

加载后的模型,我们还可以对它进行训练,这种方式叫做迁移学习。代码示例如下:

ini 复制代码
# 迁移学习
model2.fit(x2, y2, epochs=10)

参考

相关推荐
Blossom.11829 分钟前
量子网络:构建未来通信的超高速“高速公路”
网络·opencv·算法·安全·机器学习·密码学·量子计算
qsmyhsgcs31 分钟前
Java程序员转人工智能入门学习路线图(2025版)
java·人工智能·学习·机器学习·算法工程师·人工智能入门·ai算法工程师
A林玖33 分钟前
【机器学习】朴素贝叶斯
人工智能·算法·机器学习
IT从业者张某某42 分钟前
机器学习-08-时序数据分析预测
人工智能·机器学习·数据分析
归去_来兮43 分钟前
GBDT算法原理及Python实现
机器学习
安全系统学习2 小时前
网络安全之红队LLM的大模型自动化越狱
运维·人工智能·安全·web安全·机器学习·php
拓端研究室TRL2 小时前
PyMC+AI提示词贝叶斯项目反应IRT理论Rasch分析篮球比赛官方数据:球员能力与位置层级结构研究
大数据·人工智能·python·算法·机器学习
山重水复疑无路@3 小时前
NVIDIA --- 端到端自动驾驶
人工智能·机器学习·自动驾驶
像风一样_4 小时前
机器学习-入门-线性模型(2)
人工智能·机器学习