深度学习——卷积神经网络

卷积网路的组成

卷积层(提取图像特征)

卷积运算本质上就是在滤波器和输入数据的局部区域间做点积。

css 复制代码
- padding

保持尺寸 :使输出特征图(Feature Map)尺寸与输入一致(如 same 填充)。 保护边缘信息 :防止边缘像素因卷积计算次数少而被忽略。 灵活调整输出大小 :通过填充量控制输出尺寸(如 valid 不填充,输出会缩小)

diff 复制代码
- stride(设置步长)
  • 实际代码实现:

池化层(降维、防止过拟合)

  • 降低了后续网络层的输入维度,缩减模型大小,提高计算速度,并提高了FeatureMap 的鲁棒性,防止过拟合
  • 对卷积层学习到的特征图进行下采样(subsampling)处理,主要由两种:
    • 最大池化:Max Pooling,取窗口内的最大值作为输出
    • 代码实现:
    • 平均池化:Avg Pooling,取窗口内的所有值的均值作为输出
    • 代码实现:

全连接层(输出结果)

将特征图转换成一维向量送入到全连接层中进行分类或回归的操作

卷积神经网络的构建

LeNet-5是一个较简单的卷积神经网络, 输入的二维图像,先经过两次卷积层,池化层,再经过全连接层,最后使用softmax分类作为输出层。

  • 数据加载: 与神经网络的案例一致,首先加载数据集:
scss 复制代码
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
  • 数据处理 卷积神经网络的输入要求是:N H W C ,分别是图片数量,图片高度,图片宽度和图片的通道,因为是灰度图,通道为1
ini 复制代码
# 数据处理:num,h,w,c
# 训练集数据
train_images = tf.reshape(train_images,
(train_images.shape[0],train_images.shape[1],train_images.shape[2], 1))
print(train_images.shape)

# 测试集数据
test_images = tf.reshape(test_images,
(test_images.shape[0],test_images.shape[1],test_images.shape[2], 1))
  • 模型搭建 Lenet-5模型输入的二维图像,先经过两次卷积层,池化层,再经过全连接层,最后使用softmax分类作为输出层,模型构建如下
ini 复制代码
# 模型构建
net = tf.keras.models.Sequential([

# 卷积层:6个5*5的卷积核,激活是sigmoid
tf.keras.layers.Conv2D(filters=6,kernel_size=5,activation='sigmoid',input_shape=(28,28,1)),
    # 最大池化
    tf.keras.layers.MaxPool2D(pool_size=2, strides=2),
    # 卷积层:16个5*5的卷积核,激活是sigmoid
    tf.keras.layers.Conv2D(filters=16,kernel_size=5,activation='sigmoid'),
    # 最大池化
    tf.keras.layers.MaxPool2D(pool_size=2, strides=2),
    # 维度调整为1维数据
    tf.keras.layers.Flatten(),
    # 全卷积层,激活sigmoid
    tf.keras.layers.Dense(120,activation='sigmoid'),
    # 全卷积层,激活sigmoid
    tf.keras.layers.Dense(84,activation='sigmoid'),
    # 全卷积层,激活softmax
    tf.keras.layers.Dense(10,activation='softmax')
])
  • 模型编译 设置优化器和损失函数:
ini 复制代码
# 优化器
optimizer = tf.keras.optimizers.SGD(learning_rate=0.9)
# 模型编译:损失函数,优化器和评价指标
net.compile(optimizer=optimizer,
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy'])
  • 模型训练
ini 复制代码
# 模型训练
net.fit(train_images, train_labels, epochs=5, validation_split=0.1)
  • 模型评估
ini 复制代码
# 模型评估
score = net.evaluate(test_images, test_labels, verbose=1)
print('Test accuracy:', score[1])
相关推荐
max5006007 小时前
基于Meta Llama的二语习得学习者行为预测计算模型
人工智能·算法·机器学习·分类·数据挖掘·llama
王哥儿聊AI8 小时前
Lynx:新一代个性化视频生成模型,单图即可生成视频,重新定义身份一致性与视觉质量
人工智能·算法·安全·机器学习·音视频·软件工程
手握风云-10 小时前
优选算法的寻踪契合:字符串专题
算法
闭着眼睛学算法10 小时前
【华为OD机考正在更新】2025年双机位A卷真题【完全原创题解 | 详细考点分类 | 不断更新题目 | 六种主流语言Py+Java+Cpp+C+Js+Go】
java·c语言·javascript·c++·python·算法·华为od
IT古董10 小时前
【第五章:计算机视觉-项目实战之目标检测实战】2.目标检测实战:中国交通标志检测-(2)中国交通标志检测数据格式转化与读取
算法·目标检测·计算机视觉
MobotStone10 小时前
LLM 采样入门到进阶:理解与实践 Top-K、Top-P、温度控制
算法
杨小码不BUG11 小时前
CSP-J/S初赛知识点精讲-图论
c++·算法·图论··编码·csp-j/s初赛
LeaderSheepH12 小时前
常见的排序算法
数据结构·算法·排序算法
周杰伦_Jay13 小时前
【图文详解】强化学习核心框架、数学基础、分类、应用场景
人工智能·科技·算法·机器学习·计算机视觉·分类·数据挖掘
violet-lz13 小时前
Linux静态库与共享库(动态库)全面详解:从创建到应用
算法