VGG论文学习笔记

题目：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

论文下载地址：VGG论文

摘要

目的：研究深度对精度的影响
方法：使用3*3滤波器不断增加深度，16和19效果显著
成绩：在ImageNet 2014挑战赛中定位项目第1名，分类项目第2名；在其它数据集上也表现良好。

1、介绍

卷积网络（ConvNets）取得成功，得益于大规模图片库（比如ImageNet）和快速计算系统（比如GPU），也得益于ILSVRC比赛的举行。
研究深度与精度的关系，并使用小的3*3滤波器。

2、ConvNet配置

2.1 配置

输入：224*224（固定尺寸）
预处理：每个像素减去平均RGB值，其 均值为[123.68,116.78,103.94].
滤波器：3*3，也有使用1*1
卷积层参数：stride=1，padding=1
最大池化层：滤波器2*2,stride=2
全连接层：3个（前两个4096个通道，最后一个为1000个，对应分类数）
最后一层：soft-max层
激活函数：ReLU
改进：取消LRN，因为没有增加精度，反而增加计算时间占用内存。
感受野：参考感受野
重点：堆叠两个3*3的卷积核替代5*5卷积核，堆叠三个3*3的卷积核替代7*7卷积核。拥有相同的感受野，减少参数。