python3+TensorFlow 2.x(六)自编码器

自动编码器

自动编码器(Autoencoder)是一种无监督学习算法,主要用于数据降维、特征学习和数据生成等任务。它由编码器和解码器组成,目标是将输入数据压缩为低维表示(编码),然后再从这个低维表示重构原始数据。自动编码器被广泛应用于图像去噪、特征提取和生成模型等场景。

实现

MNIST 数据集重构

python 复制代码
import tensorflow as tf
from tensorflow.keras import layers, models
import matplotlib.pyplot as plt

# 加载 MNIST 数据集
(train_images, _), (test_images, _) = tf.keras.datasets.mnist.load_data()

# 归一化数据,将像素值缩放到 [0, 1]
train_images = train_images / 255.0
test_images = test_images / 255.0

# 将数据的形状调整为 (batch_size, 28, 28, 1),因为 CNN 等网络需要 4D 输入
train_images = train_images.reshape((train_images.shape[0], 28, 28, 1))
test_images = test_images.reshape((test_images.shape[0], 28, 28, 1))

# 使用 tf.data.Dataset 将数据分成批次
train_dataset = tf.data.Dataset.from_tensor_slices(train_images).batch(64)

# 构建自动编码器
def build_autoencoder():
    # 编码器
    encoder_input = layers.Input(shape=(28, 28, 1))

    # 编码层:使用卷积层和池化层提取特征
    x = layers.Conv2D(32, (3, 3), activation='relu', padding='same')(encoder_input)
    x = layers.MaxPooling2D((2, 2), padding='same')(x)
    x = layers.Conv2D(64, (3, 3), activation='relu', padding='same')(x)
    encoded = layers.MaxPooling2D((2, 2), padding='same')(x)

    # 解码器
    x = layers.Conv2D(64, (3, 3), activation='relu', padding='same')(encoded)
    x = layers.UpSampling2D((2, 2))(x)
    x = layers.Conv2D(32, (3, 3), activation='relu', padding='same')(x)
    x = layers.UpSampling2D((2, 2))(x)
    decoded = layers.Conv2D(1, (3, 3), activation='sigmoid', padding='same')(x)

    # 自动编码器模型
    autoencoder = models.Model(encoder_input, decoded)
    return autoencoder

# 构建自动编码器模型
autoencoder = build_autoencoder()

# 编译模型
autoencoder.compile(optimizer='adam', loss='binary_crossentropy')

# 训练模型
autoencoder.fit(train_images, train_images, epochs=10, batch_size=64, validation_data=(test_images, test_images))

# 使用训练好的模型对测试集进行预测
decoded_images = autoencoder.predict(test_images)

# 显示原始图像和重建图像
n = 10  # 展示 10 张图像
plt.figure(figsize=(20, 4))
for i in range(n):
    # 显示原始图像
    ax = plt.subplot(2, n, i + 1)
    plt.imshow(test_images[i].reshape(28, 28), cmap='gray')
    plt.axis('off')

    # 显示重建图像
    ax = plt.subplot(2, n, i + 1 + n)
    plt.imshow(decoded_images[i].reshape(28, 28), cmap='gray')
    plt.axis('off')

plt.show()

代码解释

加载和预处理数据

MNIST 数据集包含了 60,000 张训练图像和 10,000 张测试图像,每张图像的大小是 28x28 像素,并且所有的图像是灰度图。将图像像素值归一化到 [0, 1] 范围,并将数据形状调整为 (28, 28, 1),因为自动编码器需要图像数据作为输入。

构建自动编码器模型

自动编码器的结构由两个主要部分组成:编码器和解码器。编码器将输入数据映射到一个低维空间(潜在空间)。解码器将潜在空间的表示恢复回原始数据空间。本例中使用CNN编码器将图像通过一系列卷积层和池化层进行降维。然后,解码器通过反卷积(转置卷积)将潜在空间的表示恢复为原始的图像。

编译和训练模型

在训练模型时,使用二元交叉熵作为损失函数,因为是进行图像的重建 (像素级重建) 优化器使用 Adam 优化器,它通常在很多深度学习任务中表现良好。

评估与可视化结果

使用训练好的模型对测试集进行预测,并将原始图像和重建图像进行对比,帮助可视化自动编码器的效果。

总结

自动编码器是一种无监督学习模型,可以用于特征提取、降维和图像生成等任务。实例中使用了卷积神经网络(CNN)来构建一个简单的自动编码器,并应用于 MNIST 数据集进行训练。通过这段代码,了解如何使用 TensorFlow 2.x 实现自动编码器,训练并评估模型的性能。

相关推荐
AL.千灯学长16 分钟前
DeepSeek接入Siri(已升级支持苹果手表)完整版硅基流动DeepSeek-R1部署
人工智能·gpt·ios·ai·苹果vision pro
HealthScience29 分钟前
【异常错误】pycharm debug view变量的时候显示不全,中间会以...显示
ide·python·pycharm
LCG元1 小时前
大模型驱动的围术期质控系统全面解析与应用探索
人工智能
lihuayong1 小时前
计算机视觉:主流数据集整理
人工智能·计算机视觉·mnist数据集·coco数据集·图像数据集·cifar-10数据集·imagenet数据集
政安晨1 小时前
政安晨【零基础玩转各类开源AI项目】DeepSeek 多模态大模型Janus-Pro-7B,本地部署!支持图像识别和图像生成
人工智能·大模型·多模态·deepseek·janus-pro-7b
一ge科研小菜鸡1 小时前
DeepSeek 与后端开发:AI 赋能云端架构与智能化服务
人工智能·云原生
冰 河1 小时前
‌最新版DeepSeek保姆级安装教程:本地部署+避坑指南
人工智能·程序员·openai·deepseek·冰河大模型
维维180-3121-14551 小时前
AI赋能生态学暨“ChatGPT+”多技术融合在生态系统服务中的实践技术应用与论文撰写
人工智能·chatgpt
豌豆花下猫1 小时前
Python 潮流周刊#90:uv 一周岁了,优缺点分析(摘要)
后端·python·ai
終不似少年遊*1 小时前
词向量与词嵌入
人工智能·深度学习·nlp·机器翻译·词嵌入