RestoreFormer++: Towards Real-World Blind Face Restoration from Undegraded Key-Value Pairs(IEEE,2023,8)

RestoreFormer++: Towards Real-World Blind Face Restoration from Undegraded Key-Value Pairs(IEEE,2023,8)

Paper
GitHub

动机:认为之前的模型都只关注了图像的纹理信息,而忽视了人脸的细节信息,本文采用多尺度、交叉注意力的方式引入模型的语义信息.

总体可以分为两大部分:

  • Encoder和Decoder部分,Encoder和Decoder部分整体类似于transformer,只不过QKV并不是采用的Linear,而是Conv2D来进行映射的
  • VQVAE部分.VQVAE在Encoder和Decoder中间的潜空间进行的,并且VQVAE的输出作为Decoder的Q来进行Cross Attention,作者认为之间构建的Facial Component Dictionary并没有包含足够的语义信息,通过VQVAE进行编码的ROHQD能够包含更多的细节信息.

  • EDM,Extending Degraded Model,为了构建和真实世界类似的模糊的数据集,必须要使用一个模型模拟真实世界图像的退化过程.本文这个EDM缝合和高斯噪声、雾化等过程.

另吐槽:本文用了大量的辅助loss函数,似乎为了增强指标,具体有perceptual loss、discriminator loss、identity loss,并且判别损失不仅用在图像,也用在了对人脸关键部位的判别上.

TODO:之后在做超分的任务时可以关注一下这个EDM构造数据集的做法.

相关推荐
AI生成未来2 小时前
北交&字节最新开源ThinkGen:首次显式利用多模态CoT处理生成任务,多项任务性能SOTA
计算机视觉·aigc·多模态·思维链·视觉生成
z日火2 小时前
腾讯云VOD AIGC视频生成工具 回调实现
aigc·音视频·腾讯云
undsky2 小时前
【n8n教程】:AI Agent节点,构建你的智能自动化机器人
aigc·ai编程
imbackneverdie4 小时前
研究生如何高效完成文献综述并提炼创新点?
人工智能·ai·语言模型·自然语言处理·aigc·ai写作
Jagger_4 小时前
读《纳瓦尔宝典》的一些真实想法
aigc
Mintopia5 小时前
2025,我的「Vibe Coding」时刻
前端·人工智能·aigc
shayudiandian6 小时前
AI生成内容(AIGC)在游戏与影视行业的落地案例
人工智能·游戏·aigc
AI生成未来7 小时前
复刻“黑客帝国”子弹时间!SpaceTimePilot:视频变可操控4D游戏,倒放/变速/运镜随你掌控
人工智能·aigc·扩散模型·视频生成
小霖家的混江龙7 小时前
不再费脑, 手算 Attention 公式, 理解 Transformer 注意力的数学本质
人工智能·llm·aigc
用户479492835691518 小时前
怕 AI 乱改代码?教你用 Hooks 给 Claude Code 戴上"紧箍咒"
aigc·ai编程·claude