RestoreFormer++: Towards Real-World Blind Face Restoration from Undegraded Key-Value Pairs(IEEE,2023,8)

RestoreFormer++: Towards Real-World Blind Face Restoration from Undegraded Key-Value Pairs(IEEE,2023,8)

Paper
GitHub

动机:认为之前的模型都只关注了图像的纹理信息,而忽视了人脸的细节信息,本文采用多尺度、交叉注意力的方式引入模型的语义信息.

总体可以分为两大部分:

  • Encoder和Decoder部分,Encoder和Decoder部分整体类似于transformer,只不过QKV并不是采用的Linear,而是Conv2D来进行映射的
  • VQVAE部分.VQVAE在Encoder和Decoder中间的潜空间进行的,并且VQVAE的输出作为Decoder的Q来进行Cross Attention,作者认为之间构建的Facial Component Dictionary并没有包含足够的语义信息,通过VQVAE进行编码的ROHQD能够包含更多的细节信息.

  • EDM,Extending Degraded Model,为了构建和真实世界类似的模糊的数据集,必须要使用一个模型模拟真实世界图像的退化过程.本文这个EDM缝合和高斯噪声、雾化等过程.

另吐槽:本文用了大量的辅助loss函数,似乎为了增强指标,具体有perceptual loss、discriminator loss、identity loss,并且判别损失不仅用在图像,也用在了对人脸关键部位的判别上.

TODO:之后在做超分的任务时可以关注一下这个EDM构造数据集的做法.

相关推荐
程序员X小鹿6 小时前
刚刚,豆包重磅升级,上线Seedream 4.5!5大场景实测(附提示词)
aigc
oden10 小时前
AI工具互不兼容?MCP协议让所有工具无缝对接(附实战)
aigc·ai编程·mcp
新智元12 小时前
DeepSeek V3.2 爆火,Agentic 性能暴涨 40% 解密
人工智能·aigc
da_vinci_x13 小时前
PS 生成式扩展:从 iPad 到带鱼屏,游戏立绘“全终端”适配流
前端·人工智能·游戏·ui·aigc·技术美术·游戏美术
用户51914958484516 小时前
掌握比特币:开放区块链编程全解析
人工智能·aigc
冴羽17 小时前
不知道怎么写 Nano Banana Pro 提示词?分享你一个结构化示例,复刻任意图片
前端·人工智能·aigc
程序员鱼皮18 小时前
现在上线个小程序这么麻烦吗?!
微信小程序·程序员·aigc
后端小肥肠19 小时前
Coze+ComfyUI 实战:一键生成爆款梦核物语视频,直通剪映草稿
人工智能·aigc·coze
Mintopia19 小时前
🌐 大厂AIGC技术生态与中小Web开发者的“和谐共生”之路
人工智能·aigc·敏捷开发
技术传感器19 小时前
模型微调实战方法论:用5%的成本,获得80%的专用性能——中小企业专属模型锻造术
人工智能·架构·aigc