Learning Enriched Features for Fast Image Restoration and Enhancement 论文阅读笔记

  • 这是2022年TPAMI上发表的大名鼎鼎的MIRNetv2,是一个通用的图像修复和图像质量增强模型,核心是一个多尺度的网络

  • 网络结构整体是残差的递归,不断把残差展开可以看到是一些残差块的堆叠。核心是多尺度的MRB。网络用的损失函数朴实无华:

  • MRB的核心是RCB和SKFF两个模块,先介绍SKFF,它是用来融合多尺度特征图的,如下所示。这里的特征图是已经上采样到相同尺度了,相加做一个global average pooling和全连接层后,分成两个向量,各自再全连接层一次,然后softmax归一化使得两个向量的加和处处为1,然后进行通道加权后相加。

  • RCB模块如下图所示,具体做什么都能看懂,其实就是卷积加提取了一个C维的通道偏置

  • 训练的时候使用了progressive training,先用小patch训练,慢慢增大patch size

  • 实验结果(我只关注暗图增强)可以看到PSNR还是蛮高的,视觉效果也不错:

  • 启发是,一个高性能的网络,用简单的距离损失函数进行有监督训练,能够产生很好的增强结果

相关推荐
闲看云起4 小时前
Bert:从“读不懂上下文”的AI,到真正理解语言
论文阅读·人工智能·深度学习·语言模型·自然语言处理·bert
sealaugh326 小时前
AI(学习笔记第十二课) 使用langsmith的agents
人工智能·笔记·学习
QZ_orz_freedom6 小时前
学习笔记--事务管理
笔记·学习
程序员大雄学编程6 小时前
「机器学习笔记14」集成学习全面解析:从Bagging到Boosting的Python实战指南
笔记·机器学习·集成学习
im_AMBER7 小时前
Web 开发 30
前端·笔记·后端·学习·web
试试勇气7 小时前
Linux学习笔记(八)--环境变量与进程地址空间
linux·笔记·学习
蒙奇D索大7 小时前
【数据结构】考研数据结构核心考点:平衡二叉树(AVL树)详解——平衡因子与4大旋转操作入门指南
数据结构·笔记·学习·考研·改行学it
郭庆汝8 小时前
自然语言处理笔记
笔记·自然语言处理·easyui
二进制怪兽8 小时前
[笔记] 驱动开发:Virtual-Display-Driver编译过程
笔记
ouliten8 小时前
cuda编程笔记(28)-- cudaMemcpyPeer 与 P2P 访问机制
笔记·cuda