Tensorflow实现手写数字识别

|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 模型架构 * 具有10个神经元,对应10个类别(0-9的数字)。 * 使用softmax激活函数,对多分类问题进行概率归一化。 * 输出层 (Dense): * 具有64个神经元。 * 激活函数为ReLU。 * 全连接层 (Dense): * 将二维数据展平成一维,为全连接层做准备。 * 展平层 (Flatten): * 第三层卷积层有64个过滤器。 * 使用3x3的卷积核。 * 激活函数为ReLU。 * 卷积层 (Conv2D): * 池化大小为2x2。 * 最大池化层 (MaxPooling2D): * 第二层卷积层有64个过滤器。 * 使用3x3的卷积核。 * 激活函数为ReLU。 * 卷积层 (Conv2D): * 池化大小为2x2。 * 通过池化操作减小特征图的尺寸,同时保留最重要的信息。 * 最大池化层 (MaxPooling2D): * 第一层卷积层有32个过滤器(filters)。 * 使用3x3的卷积核。 * 激活函数为ReLU。 * 输入形状为28x28的单通道图像(黑白图像)。 * 卷积层 (Conv2D): |

python 复制代码
import tensorflow as tf

from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist

# 载入 MNIST 数据集
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# 数据预处理
train_images = train_images.reshape((60000, 28, 28, 1)).astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1)).astype('float32') / 255

train_labels = tf.keras.utils.to_categorical(train_labels)
test_labels = tf.keras.utils.to_categorical(test_labels)

# 构建神经网络模型
model = models.Sequential([
    # 第一层:卷积层
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),

    # 第二层:最大池化层
    layers.MaxPooling2D((2, 2)),

    # 第三层:卷积层
    layers.Conv2D(64, (3, 3), activation='relu'),

    # 第四层:最大池化层
    layers.MaxPooling2D((2, 2)),

    # 第五层:卷积层
    layers.Conv2D(64, (3, 3), activation='relu'),

    # 将二维数据展平成一维
    layers.Flatten(),

    # 第六层:全连接层(密集层),64个神经元,ReLU激活函数
    layers.Dense(64, activation='relu'),

    # 输出层:全连接层,10个神经元(对应10个类别,0-9的数字),使用softmax激活函数
    layers.Dense(10, activation='softmax')
])

# 编译模型
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# 训练模型
model.fit(train_images, train_labels, epochs=5, batch_size=64, validation_split=0.2)

# 在测试集上评估模型
test_loss, test_acc = model.evaluate(test_images, test_labels)
print(f'Test accuracy: {test_acc}')

编译模型:

python 复制代码
model.compile( 
	optimizer,    # 优化器,用于配置模型的学习过程。常见的有 'adam'、'sgd' 等。
	loss,         # 损失函数,用于衡量模型在训练时的性能。常见的有 'categorical_crossentropy'、'mse' 等。 
	metrics=None  # 评估指标,用于监控训练和测试性能。可以是一个字符串或字符串列表。例如,'accuracy'。
 )

optimizer(优化器):

优化器决定了模型如何进行参数更新,以最小化损失函数。常见的优化器包括 'adam'、'sgd'、'rmsprop' 等。不同的优化器可能适用于不同类型的问题。

loss(损失函数):

损失函数用于衡量模型在训练时的性能,即模型预测与实际标签之间的差异。对于不同的问题,需要选择合适的损失函数。例如,对于分类问题,常见的是 'categorical_crossentropy',而对于回归问题,可能是 'mse'(均方误差)。

metrics(评估指标):

评估指标用于监控模型的性能。在训练和测试过程中,会输出这些指标的值。例如,'accuracy' 表示模型的准确性。你可以传递一个字符串或一个字符串列表,以同时监控多个指标。

相关推荐
szxinmai主板定制专家几秒前
基于ARM+FPGA高性能MPSOC 多轴伺服设计方案
arm开发·人工智能·嵌入式硬件·fpga开发·架构
fqrj20263 分钟前
网站建设公司怎么选?国内口碑网站建设公司推荐哪家?
大数据·人工智能·html·网站开发
u0109147604 分钟前
C#怎么使用Span和Memory C#如何用Span优化内存操作减少GC压力提升性能【进阶】
jvm·数据库·python
minhuan5 分钟前
大模型对抗性训练:防御Prompt攻击与恶意生成生成攻击,提升模型安全性.153
人工智能·大模型对抗性训练·prompt安全机制·大模型应用安全
QQ676580085 分钟前
智慧工地要素识别数据集 塔吊挂钩识别数据集 吊物识别数据集 工地人员识别数据集 目标检测识别 工地识别数据集
人工智能·目标检测·目标跟踪·工地要素识别·塔吊挂钩·吊物识别·工地人员识别
AI服务老曹5 分钟前
[深度解析] 兼容 X86/ARM 与多模态 NPU:基于 GB28181/RTSP 的工业级 AI 视频中台架构设计
arm开发·人工智能·音视频
qcx236 分钟前
【AI Agent实战】零基础用 AI Agent 做电商调研:5 道题 + 6 份 Prompt,跑通一家 16 亿品牌的完整拆解
人工智能·chatgpt·prompt
m0_716430077 分钟前
CSS项目开发如何提速_应用BEM规范建立可复用的样式库
jvm·数据库·python
IT_陈寒7 分钟前
React状态管理这个坑,我终于爬出来了
前端·人工智能·后端
Byron__7 分钟前
AI学习_04_向量概念
人工智能·学习