深度学习之 RefineNet

网络结构:

RefineNet block的作用就是把不同resolution level的feature map进行融合。网络结构如下:

最左边一栏就是FCN的encoder部分(文中是用的ResNet),先把pretrained ResNet按feature map的分辨率分成四个ResNet blocks,然后向右把四个blocks分别作为4个path通过RefineNet block进行融合refine,最后得到一个refined feature map(接softmax再双线性插值输出)。

注意除了RefineNet-4,所有的RefineNet block都是二输入的,用于融合不同level做refine,而单输入的RefineNet-4可以看作是先对ResNet的一个task adaptation。

RefineNet Block

接下来仔细看一下RefineNet block,可以看到主要组成部分是Residual convolution unit, Multi-resolution fusion, Chained residual pooling, Output convolutions. 切记这个block作用是融合多个level的feature map输出单个level的feature map,但具体的实现应该是和输入个数、shape无关的。

Residual convolution unit就是普通的去除了BN的residual unit;

Multi-resolution fusion是先对多输入的feature map都用一个卷积层进行adaptation(都化到最小的feature map的shape),再上采样再做element-wise的相加。注意如果是像RefineNet-4那样的单输入block这一部分就直接pass了;

Chained residual pooling中的ReLU对接下来池化的有效性很重要,还可以使模型对学习率的变化没这么敏感。这个链式结构能从很大范围区域上获取背景context。另外,这个结构中大量使用了identity mapping这样的连接,无论长距离或者短距离的,这样的结构允许梯度从一个block直接向其他任一block传播。

Output convolutions就是输出前再加一个RCU。

相关推荐
数智工坊3 分钟前
【深度学习基础】Focal Loss、Dice Loss、组合损失函数
人工智能·深度学习
伯远医学4 分钟前
如何判断提取的RNA是否可用?
java·开发语言·前端·javascript·人工智能·eclipse·创业创新
这张生成的图像能检测吗5 分钟前
(论文速读)物联网系统边缘设备上的节能快速目标检测
人工智能·计算机视觉·目标跟踪
愚公搬代码5 分钟前
【愚公系列】《剪映+DeepSeek+即梦:短视频制作》045-运动:动起来的画面更好玩(AI智能运镜:一键生成动态镜头)
人工智能
2501_933329556 分钟前
舆情监测系统的技术演进:从关键词匹配到AI驱动的智能中台
人工智能·自然语言处理·重构
QYR-分析7 分钟前
2026全球无人机电子调速器(ESC)市场发展分析及机遇展望
人工智能·机器人·无人机
七夜zippoe11 分钟前
OpenClaw 文件操作详解:从基础到实战
大数据·人工智能·文件操作·read·openclaw
超级AI_mes18 分钟前
2026电子组装行业MES转型指南:从智能防错到AI驱动的全链路数字化方案
人工智能·科技·5g·信息可视化·社交电子·能源·制造
LaughingZhu24 分钟前
Product Hunt 每日热榜 | 2026-04-03
数据库·人工智能·经验分享·神经网络·chatgpt·语音识别
北京软秦科技有限公司24 分钟前
AI报告编审解决方案引领生产报告3.0:IA-Lab AI检测报告生成助手协同IACheck,重塑检测行业效率与质量标准
人工智能