24/10/12 算法笔记 汇聚层

汇聚(pooling)层等于池化层,它具有双重目的:降低卷积层对位置的敏感性,同时降低对空间降采样表示的敏感性。

空间降采样通常指的是在图像或信号处理中,通过减少数据的空间维度来降低数据量,同时尽可能保留重要的信息。

在卷积神经网络(CNN)中,卷积层对空间降采样具有一定的敏感性,这意味着卷积层对输入数据的空间位置变化比较敏感。例如,如果输入图像中的一个特征(如边缘或纹理)发生轻微的平移,卷积层可能会检测到不同的输出。这种敏感性在某些情况下是有益的,因为它允许网络捕捉到精确的特征位置,但在其他情况下,我们可能希望网络对输入的微小变化更加鲁棒。

为了降低这种敏感性并提高网络对输入变化的鲁棒性,通常会在卷积层之后引入池化层(Pooling Layer)。

复制代码
def pool2d(X, pool_size, mode='max'):
    p_h, p_w = pool_size
    Y = torch.zeros((X.shape[0] - p_h + 1, X.shape[1] - p_w + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            if mode == 'max':
                Y[i, j] = X[i: i + p_h, j: j + p_w].max()
            elif mode == 'avg':
                Y[i, j] = X[i: i + p_h, j: j + p_w].mean()
    return Y

多通道

在处理多通道输入数据时,汇聚层在每个输入通道上单独运算,而不是像卷积层一样在通道上对输入进行汇总。 这意味着汇聚层的输出通道数与输入通道数相同。

所以要连接张量构建通道。

复制代码
X = torch.cat((X, X + 1), 1)
相关推荐
卧式纯绿7 分钟前
每日文献(八)——Part one
人工智能·yolo·目标检测·计算机视觉·目标跟踪·cnn
chushiyunen11 分钟前
dom操作笔记、xml和document等
xml·java·笔记
巷95513 分钟前
OpenCV图像形态学:原理、操作与应用详解
人工智能·opencv·计算机视觉
chushiyunen14 分钟前
tomcat使用笔记、启动失败但是未打印日志
java·笔记·tomcat
汇能感知18 分钟前
光谱相机的光谱数据采集原理
经验分享·笔记·科技
人人题41 分钟前
汽车加气站操作工考试答题模板
笔记·职场和发展·微信小程序·汽车·创业创新·学习方法·业界资讯
深蓝易网42 分钟前
为什么制造企业需要用MES管理系统升级改造车间
大数据·运维·人工智能·制造·devops
xiangzhihong81 小时前
Amodal3R ,南洋理工推出的 3D 生成模型
人工智能·深度学习·计算机视觉
小脑斧爱吃鱼鱼1 小时前
鸿蒙项目笔记(1)
笔记·学习·harmonyos
狂奔solar1 小时前
diffusion-vas 提升遮挡区域的分割精度
人工智能·深度学习