Learning Enriched Features for Fast Image Restoration and Enhancement 论文阅读笔记

  • 这是2022年TPAMI上发表的大名鼎鼎的MIRNetv2,是一个通用的图像修复和图像质量增强模型,核心是一个多尺度的网络

  • 网络结构整体是残差的递归,不断把残差展开可以看到是一些残差块的堆叠。核心是多尺度的MRB。网络用的损失函数朴实无华:

  • MRB的核心是RCB和SKFF两个模块,先介绍SKFF,它是用来融合多尺度特征图的,如下所示。这里的特征图是已经上采样到相同尺度了,相加做一个global average pooling和全连接层后,分成两个向量,各自再全连接层一次,然后softmax归一化使得两个向量的加和处处为1,然后进行通道加权后相加。

  • RCB模块如下图所示,具体做什么都能看懂,其实就是卷积加提取了一个C维的通道偏置

  • 训练的时候使用了progressive training,先用小patch训练,慢慢增大patch size

  • 实验结果(我只关注暗图增强)可以看到PSNR还是蛮高的,视觉效果也不错:

  • 启发是,一个高性能的网络,用简单的距离损失函数进行有监督训练,能够产生很好的增强结果

相关推荐
LinXunFeng3 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
闪闪发亮的小星星7 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq7 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
凌晨一点的秃头猪7 天前
论文阅读 GTI(Graph-based Tree Index): 面向高维空间最近邻搜索的动态图-树混合索引结构
论文阅读
阿米亚波7 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.7 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
有Li7 天前
PTCMIL:基于提示 token 聚类的全切片图像多实例学习分析文献速递/多模态医学影像最新进展
论文阅读·学习·数据挖掘·聚类·文献·医学生
.千余7 天前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.7 天前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
大模型最新论文速读7 天前
06-16 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理