学习日记35：Rep3d

摘要：

3D 医学图像分割依赖大有效感受野 (ERF)建模长程空间依赖，Transformer 存在计算复杂度高、细粒度分割精度差的缺陷，传统 CNN 直接扩大卷积核会引发优化不稳定、性能饱和、参数爆炸问题。该文从理论上证明了结构重参数化块会导致空间上不同的学习速率，由此提出Rep3d，使用轻量级调制网络来生成基于接收域的缩放掩码，在普通编码器体系结构中自适应地重新加权内核更新。

介绍：

论文的出发点还是为卷积核赋予近似Transformer的长距离建模能力，一个方式就是使用更大的卷积核。但是，简单的增加卷积核大小并不能提高性能，标准卷积依赖于静态的、权重共享的核，并且缺乏跨空间位置调节重要性的能力；结构重参数化之前学习过，就是训练时网络中使用不同大小卷积核的并行路径，在推理时，将不同大小的卷积核融合得到唯一路径（CLSA）。该文章想在大核卷积中引入空间先验，还想在训练过程中就实现重参数化。

为了达成这个目的，作者首先对CSLA进行了理论分析，发现每个分支相当于在不同的学习率下进行更新，导致收敛速度的元素差异，这与人类视觉相似，于是提出了一种新的接受性偏差再参数化策略，该策略将距离核中心的空间距离编码为学习前的空间偏差。