一、CNN 用于图像分类
需要图片大小统一
彩色图像分为R G B 三层,展平后首尾相接
值代表着颜色的强度
图像识别中不需要全连接的,参数太多了
观测1:通过判断多个小局部图像就能判断出图片标签
感受野的定义
简化1
- 感受野可以重叠;
- 同一感受野可以通过不同的权重
典型设置
观测2:相同部分出现在不同区域
简化2
共享参数
典型设置
引入filter的概念,实质是同一套权重
卷积的优势
- 有些要素比整张图片小的多
- 同一要素可能会出现在不同区域
二、另一角度切入
卷积层
多次经过卷积层
在第二次卷积时,输入的原始图片信息增加了!
所以不是一直分区域处理的。随着层数的增加,考虑的范围会逐渐变大
三、两种介绍的对比
分享的权重其实就是filter
卷积 = 不同的filter扫过整个矩阵 = 不同的感受野公用权重参数
观测3:截出主要元素不会改变标签
引入池化层
每次选出一个作为代表
MAX pooling:每个区域选出最大的作为代表
四、CNN全过程总结
五、应用:下围棋
每个棋子有48个channel,代表48个状态
CNN为啥能用于下围棋?因为他们的这两点特征相似
由于棋子不能省略,用于围棋中不能加入池化层
更多应用:语音、自然语音处理。。。