深度学习入门（三）：卷积神经网络（CNN）

一个很菜的小猪2023-08-23 21:39

引入

给定一张图片，计算机需要模型判断图里的东西是什么？

（car、truck、airplane、ship、horse）

一、卷积神经网络整体架构

CONV：卷积计算层，线性乘积求和
RELU：激励层，激活函数
POOL：池化层，取区域平均或最大（MAX POOL）
PC：全连接层

二、CONV卷积层计算

对CNN来说，它是一块一块进行对比的，"小块"称之为Features特征。卷积就是对图像（不同窗口数据）和滤波矩阵做内积 。每计算完一个数据窗口内的数据后，数据窗口不断平滑移动，直到计算完所有数据。

图中矩阵解析：

Input Volume（7x7x3）：图像的长宽均为7，3代表RGB三个颜色通道
Filter W0、W1：滤波器，带一组固定权重的神经元
Output Volume：两个不同的输出

随着左边数据窗口的平移滑动，滤波器 F i l t e r W 0 / W 1 Filter W0/W1 FilterW0/W1对不同的局部数据进行卷积计算。左边数据在变化，每次滤波器都是针对某一局部的数据窗口进行卷积 ，这就是所谓的CNN中的局部感知机制 。与此同时，数据窗口滑动，导致输入在变化，但中间滤波器Filter w0的权重是固定不变 的，这个权重不变即所谓的CNN中的参数（权重）共享机制。

三、卷积层参数

depth：神经元个数，滤波器个数
stride：步长，滑动多少步到边缘
zero-padding：边缘填充，为了总长能为步长整除，并且一定程度上减轻边界利用少的情况

四、ReLU激励层

五、POOL池化层

进行筛选压缩的过程，取区域平均或最大

最大池化 MAX POOLING

下图包含两次卷积一次池化，共7层神经网络

六、特征图变化

三维要拉长成特征向量，再输入全接连层