15.卷积神经网络

卷积神经网络（Convolutional Neural Network），多用于图像处理。

全连接的问题

回顾手写数字识别，我们需要将一张图片的所有像素点，展开成一个1维向量输入到网络。那么，当图片尺寸特别大时，要求的输入神经元的个数会特别大，参数多训练慢，还容易发生过拟合。除此之外，对于彩色图片而言，如果将RGB三个通道数据单纯展开铺平，会丢失空间信息。

卷积神经网络，引入卷积层，通过卷积核对图像特征进行提取，维护像素点之间的特征信息，同时也保证了参数个数不随图像尺寸变化。

经典的卷积神经网络包含：对图片进行多层卷积、池化，最后加上全连接层。在卷积和全连接的最终输出往往加上ReLu函数，有时也会引入Dropout防止过拟合。

卷积核（kernel），又称滤波器（filter）

卷积运算，是通过卷积核在图片上移动，计算点乘求和得到的。注意，卷积往往在计算结束后还会加偏置项（bias），一个卷积核对应一个偏置项。在卷积层部分训练学习的，也就是机器调整的，就是卷积核和偏置项。

假设偏置项为1，计算结果如下：

对于多通道彩色图片，根据需求，有单输出和多输出两种情况。

单输出，用一组卷积核计算

多输出，用多组卷积核计算

在网络训练时，往往将小批量的多张图片同时进行训练，输入图片维度为：

假设输入2张3x3的三通道彩色图片，其形状为(2,3,3,3)

我们的图片经过卷积后，尺寸会变小，那么，卷积后的点，对应原图中的区域大小，我们称作感受野（Receptive Filed）

经过两次3x3的卷积后，感受野会变为5x5

边缘填充（Padding），在卷积的过程中，由于尺寸不足或尺寸保持，我们需要对图片的尺寸进行补充，这个过程叫边缘填充。

填充可以填充0、临近值等等。不进行填充（VALID），尺寸保持填充（SAME）

卷积核大小一般为1,3，5,7等奇数，如果

那么经过卷积后，图片尺寸保持不变

卷积后尺寸计算公式，stride步长，指的是每次计算移动的距离

池化（pooling或subsampling），特征提取，降低尺寸。尺寸减半，通道数不变