RestoreFormer++: Towards Real-World Blind Face Restoration from Undegraded Key-Value Pairs(IEEE,2023,8)

RestoreFormer++: Towards Real-World Blind Face Restoration from Undegraded Key-Value Pairs(IEEE,2023,8)

Paper
GitHub

动机:认为之前的模型都只关注了图像的纹理信息,而忽视了人脸的细节信息,本文采用多尺度、交叉注意力的方式引入模型的语义信息.

总体可以分为两大部分:

  • Encoder和Decoder部分,Encoder和Decoder部分整体类似于transformer,只不过QKV并不是采用的Linear,而是Conv2D来进行映射的
  • VQVAE部分.VQVAE在Encoder和Decoder中间的潜空间进行的,并且VQVAE的输出作为Decoder的Q来进行Cross Attention,作者认为之间构建的Facial Component Dictionary并没有包含足够的语义信息,通过VQVAE进行编码的ROHQD能够包含更多的细节信息.

  • EDM,Extending Degraded Model,为了构建和真实世界类似的模糊的数据集,必须要使用一个模型模拟真实世界图像的退化过程.本文这个EDM缝合和高斯噪声、雾化等过程.

另吐槽:本文用了大量的辅助loss函数,似乎为了增强指标,具体有perceptual loss、discriminator loss、identity loss,并且判别损失不仅用在图像,也用在了对人脸关键部位的判别上.

TODO:之后在做超分的任务时可以关注一下这个EDM构造数据集的做法.

相关推荐
DS随心转小程序4 小时前
ChatGPT和Gemini公式
人工智能·chatgpt·aigc·word·豆包·deepseek·ds随心转
小程故事多_807 小时前
从14.3%到94.3%,破解Agent联网搜索“噪声致幻”的核心密码
人工智能·aigc
imbackneverdie7 小时前
2026年国自然申请书“瘦身提质”!
人工智能·ai·自然语言处理·aigc·国自然·国家自然科学基金
小程故事多_808 小时前
突破AI Infra开发困境,文档驱动的Vibe Coding实践之道
人工智能·aigc
小程故事多_809 小时前
A2UI协议,打破Agent交互壁垒,让智能系统自主“搭建”界面
人工智能·aigc·交互
codeaideaai10 小时前
Ralph for Claude Code实现24小时无人编程
aigc
长飞哥10 小时前
一个免费的AI设计平台
aigc·文生图·图生图·风格迁移·电商设计·3d文字
cjqbg1 天前
灵芽API:企业级大模型API聚合网关架构解析与成本效益对比
人工智能·架构·aigc·ai编程
快降重科研小助手1 天前
文科论述深度改写|挑战哲学论述文,“快降重”如何应对思辨文本?
人工智能·经验分享·aigc·ai写作·降重·降ai率
骥龙1 天前
第一篇:背景篇 - 为什么医院需要自己的超算?
云计算·aigc·gpu算力