机器学习入门(十一)常见的神经网络汇总

上一篇文章介绍了 RNN,这一篇文章将介绍一下其他常见的神经网络。

循环神经网络(RNN)

循环神经网络(RNN),用于处理序列数据 。与传统的神经网络不同,RNN具有循环连接,使得它可以在处理序列时保持一种记忆状态。图片来源这里

如上图所示,RNN 的隐藏层会把当前时间步的输入和上一个时间步的隐藏状态作为输入。通过这种循环,使得RNN可以处理变长序列,并且能够捕捉到序列中的时序信息。

长短时记忆网络(LSTM)

传统的RNN在处理长序列时存在梯度消失和梯度爆炸的问题,这限制了其对长期依赖关系的建模能力。为了解决这个问题,出现了长短时记忆网络(LSTM),它是一种改进的循环神经网络(RNN)架构。

LSTM 引入了一个记忆单元(memory cell),该单元可以存储和访问信息,并通过门控机制来控制信息的流动。LSTM 的关键部分包括输入门 (input gate)、遗忘门 (forget gate)、输出门 (output gate)。如下图所示,图片来源这里

生成对抗网络(GAN)

GAN包含有两个模型,一个是生成模型(generative model),一个是判别模型(discriminative model)。生成模型的任务是生成看起来自然真实的、和原始数据相似的实例。判别模型的任务是判断给定的实例看起来是自然真实的还是人为伪造的(真实实例来源于数据集,伪造实例来源于生成模型)。二者关系形成对抗,因此叫对抗网络。

模型的保存和加载

之前介绍过,我们可以使用 keras 库来训练对应的神经网络模型。这里介绍一下,如何保存和加载已经训练好的模型。代码示例如下:

ini 复制代码
# 存储模型
import joblib
joblib.dump(model1, 'model1.m')
# 模型加载
model2 = joblib.load('model1.m')

加载后的模型,我们还可以对它进行训练,这种方式叫做迁移学习。代码示例如下:

ini 复制代码
# 迁移学习
model2.fit(x2, y2, epochs=10)

参考

相关推荐
硅谷秋水8 小时前
HARBOR:一个面向具身智体机器人强化学习的驾驭框架
人工智能·深度学习·机器学习·机器人
Rocky Ding*11 小时前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
学术头条11 小时前
清华团队开源SCAIL-2:角色动画告别骨骼依赖,端到端还原视频中动作细节
人工智能·科技·机器学习·ai·开源·音视频·agi
Black蜡笔小新12 小时前
制造业AI质检工作站/企业AI算力工作站DLTM助力制造业质检智能化升级
人工智能·深度学习·机器学习
大C聊AI14 小时前
通用大模型纷纷收费,垂直场景AI工具的价值正在被重估
大数据·人工智能·机器学习·办公效率·ai 工具·智标领航·ai 辅助办公
苏州邦恩精密14 小时前
2026江苏GOM三维扫描仪定制厂家找哪家?企业数字化转型视角
人工智能·机器学习·3d·自动化·制造
王小王-12315 小时前
基于机器学习算法的恶意软件行为分析与检测系统设计与实现
机器学习·pyqt5·检测系统·恶意软件行为检测
Godspeed Zhao15 小时前
Level 4自动驾驶系统设计0——功能与场景0
人工智能·机器学习·自动驾驶
CCC:CarCrazeCurator15 小时前
大模型核心注意力机制技术深度报告:MHA、MQA、GQA 与 MLA 技术原理、性能对比与场景适配
人工智能·机器学习·自动驾驶·transformer