【学习】感受野

感受野(receptive field)是指在神经网络中,某一层输出的特征图上的一个像素点对应输入图像的区域大小。在深度神经网络中,随着网络层数的增加,特征图的感受野也会逐渐增大。这是因为每一层的卷积操作都会扩大感受野。

为什么卷积操作会扩大感受野

如上图所示,对于一个5x5的图像,第一次采用了3x3卷积,第二次也是3x3卷积,但是图中只是画出了第二次卷积中获得的一个点。

第二次卷积的一个点,他的感受野是第一次卷积的9个点,而第一次卷积对于的9个点,如图中红圈1和红圈2所示,该层9个点可以包含整个5x5图像。所以第二层卷积的感受野是5x5,而第一层是3x3。

假设我们有一个输入图像,大小为5x5。在第一层使用3x3的卷积核进行卷积操作时,卷积核会滑动在输入图像上,每次都对应一个3x3的区域,生成一个输出特征图。这个输出特征图的每个像素点,都受到了输入图像上相应的3x3区域内的信息影响。这样,第一层的每个输出像素点的感受野是3x3,因为它只能看到输入图像的一个3x3的局部区域。

现在,让我们来看第二层。假设我们再次使用一个3x3的卷积核对第一层的输出特征图进行卷积操作。这个3x3的卷积核会滑动在第一层的输出特征图上,每次也对应一个3x3的区域。但是这次不同的是,第一层的每个输出像素点都代表了输入图像上一个5x5的局部区域的信息。因此,第二层的每个输出像素点的感受野是5x5,因为它可以看到输入图像的一个5x5的局部区域。

换句话说,在第二层中,每个输出像素点都可以追溯到输入图像的更大区域,这是因为它们是由第一层输出的像素点通过卷积操作得到的。因此,第二层的感受野比第一层大,这种情况会随着网络层数的增加而继续发生,从而导致特征图的感受野逐渐增大。

相关推荐
翔云 OCR API5 小时前
人脸识别API开发者对接代码示例
开发语言·人工智能·python·计算机视觉·ocr
roman_日积跬步-终至千里5 小时前
【强化学习基础(2)】被动强化学习:学习价值函数
学习
AndrewHZ6 小时前
【图像处理基石】如何在图像中提取出基本形状,比如圆形,椭圆,方形等等?
图像处理·python·算法·计算机视觉·cv·形状提取
逢考必过@k6 小时前
6级550学习ing
学习
陈天伟教授7 小时前
基于学习的人工智能(7)机器学习基本框架
人工智能·学习
Z***G4798 小时前
网络爬虫学习:借助DeepSeek完善爬虫软件,实现模拟鼠标右键点击,将链接另存为本地文件
爬虫·学习·计算机外设
编程小白_正在努力中9 小时前
神经网络深度解析:从神经元到深度学习的进化之路
人工智能·深度学习·神经网络·机器学习
无风听海9 小时前
神经网络之经验风险最小化
人工智能·深度学习·神经网络
音视频牛哥9 小时前
轻量级RTSP服务的工程化设计与应用:从移动端到边缘设备的实时媒体架构
人工智能·计算机视觉·音视频·音视频开发·rtsp播放器·安卓rtsp服务器·安卓实现ipc功能
我命由我123459 小时前
微信开发者工具 - 模拟器分离窗口与关闭分离窗口
前端·javascript·学习·微信小程序·前端框架·html·js