卷积层(特征提取器)
利用一个滑动窗口(卷积核)在图片上移动,计算窗口内像素与卷积核权重的乘积之和,用以捕捉局部特征(如边缘、纹理)。
:
卷积后生成的新图片(特征图)在坐标处的值。你可以理解为:这是侦探扫描完这一小块区域后得出的"结论得分"。
:
这是两个求和符号。意思是我们要把这个小窗口里所有算出来的结果都加起来。
:
这是原始图片 里的像素值。表示当前扫描窗口覆盖的那一小块区域。
:
这是卷积核(也叫滤镜/权重)。它是模型学习到的核心。比如,如果它是一个"横线滤镜",那么它的数值排列就像一条横线。
:
这是一个常数,就像调色时的"底色"。即使前面算出来是 0,加上偏置也可以微调最后的结果。
尺寸计算公式
:输入高度
:填充(在图片外围补 0 的圈数)
:卷积核尺寸
:步长(每次滑动几个像素)
:向下取整
输入的图,卷积核
,步长1,填充0:
结果为
激活函数------非线性引入
如果没有激活函数,多层神经网络退化为线性回归。ReLU负责舍弃负信号,保留正信号。
池化层------降维与压缩
通过取局部区域的最大值或平均值,减少数据量,提高模型的容错性。
全连接层------最终分类
将前面提取的所有特征图"打碎"成一维向量,最后通过加权求和得出每个类别的得分。
:输入特征向量
:权重矩阵
完整流程
