神经网络模型---ResNet

一、ResNet

1.导入包

python 复制代码
import tensorflow as tf
from tensorflow.keras import layers, models, datasets, optimizers

optimizers是用于更新模型参数以最小化损失函数的算法

2.加载数据集、归一化、转为独热编码的内容一致

3.增加颜色通道

python 复制代码
train_images = train_images[..., tf.newaxis].astype("float32")
test_images = test_images[..., tf.newaxis].astype("float32")

在train_images和test_images最后一个维度增加一个新的维度
这两行代码还将图像数据转换为浮点数类型

4.定义一个用于图像预处理的模型

4.1创造模型

python 复制代码
preprocessing = models.Sequential([

4.2添加一个卷积层,该层有3个1x1的卷积核,激活函数为relu,并且指定了输入形状为28x28像素的单通道图像

python 复制代码
layers.Conv2D(3, (1, 1), activation='relu', input_shape=(28, 28, 1)),

4.3 将图像尺寸增加到56x56

python 复制代码
    layers.UpSampling2D((2, 2)), 
])

5.应用预处理模型到训练和测试图像上

python 复制代码
train_images = preprocessing(train_images)
test_images = preprocessing(test_images)

6.加载ResNet50模型并冻结所有层

python 复制代码
base_model=tf.keras.applications.ResNet50(weights='imagenet',include_top=False,input_shape=(56, 56, 3))

ResNet50是一个预训练的卷积神经网络模型,
参数1:加载模型的权重
参数2:是否包括模型顶部的全连接层,设置False意味着不包括这些层,由此可以得到模型的特征提取部分
参数3:输入图像的尺寸
base_model.trainable = False
使ResNet50模型的所有层都不可训练

7.创建模型

python 复制代码
model = models.Sequential([

7.1放在模型的第一层添加到序列中,用于提取图像特征

python 复制代码
base_model,

7.2在Keras中添加的一个全局平均池化层

python 复制代码
layers.GlobalAveragePooling2D(),

7.3在Keras中添加的一个全连接层,使用softmax为激活函数

python 复制代码
    layers.Dense(10, activation='softmax')
])

8.编译模型

python 复制代码
model.compile(optimizer=optimizers.Adam(),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

  • 和上一个博客的模型的内容一样,此处省略

9.训练模型

python 复制代码
model.fit(train_images, train_labels, epochs=10, batch_size=64, validation_data=(test_images, test_labels))

结果:

10.保存文件

python 复制代码
model.save('ResNet.h5')

结果:

相关推荐
LaughingZhu7 小时前
Product Hunt 每日热榜 | 2026-02-14
数据库·人工智能·经验分享·神经网络·搜索引擎·chatgpt
大模型探员7 小时前
告别答非所问!深度解析文档切分如何决定RAG的搜索上限
人工智能
民乐团扒谱机7 小时前
【读论文】深度学习中的卷积算术指南 A guide to convolution arithmetic for deep learning
人工智能·深度学习·神经网络·机器学习·cnn·卷积神经网络·图像识别
byzh_rc8 小时前
[深度学习网络从入门到入土] 拓展 - Inception
网络·人工智能·深度学习
阿里巴巴淘系技术团队官网博客8 小时前
从应用架构的视角看退小宝AI助手落地现状
人工智能·架构
寻星探路8 小时前
【JVM 终极通关指南】万字长文从底层到实战全维度深度拆解 Java 虚拟机
java·开发语言·jvm·人工智能·python·算法·ai
Elastic 中国社区官方博客8 小时前
DevRel 通讯 — 2026 年 2 月
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·jina
一个天蝎座 白勺 程序猿8 小时前
飞算JavaAI:从情绪价值到代码革命,智能合并项目与定制化开发新范式
人工智能·ai·自动化·javaai
田里的水稻8 小时前
FA_融合和滤波(FF)-联邦滤波(FKF)
人工智能·算法·数学建模·机器人·自动驾驶
摘星编程9 小时前
解析CANN ops-transformer的FlashAttention算子:注意力机制的内存优化
人工智能·深度学习·transformer