SPIRE: Semantic Prompt-Driven Image Restoration 论文阅读笔记

  • 这是一篇港科大学生在google research 实习期间发在ECCV2024的语义引导生成式修复的文章,港科大陈启峰也挂了名字。从首页图看效果确实很惊艳,尤其是第三行能用文本调控修复结果牌上的字。不过看起来更倾向于生成,对原图内容并不是很复原(不过在生成式方法中已经做得很好了),适合超级噪声图这种原图信息丢失十分严重的场景:
  • 整体方法流程如下图所示,用的是stable diffusion的框架,甚至模型参数都是pretrain好后fix住的,在此之上,用controlnet的风格添加了另外一部分网络,来接收restoration的描述和degraded image,网络中的feature来调制这个train好的stable diffusion的unet中的feature,然后是可train的:
  • 现在diffusion有了两个目标,一个是原有的stable diffusion在denoise的过程中还是文本梯度,另一个是最终生成的图片要和输入的LQ图片内容一致,而这部分梯度分开由需要train的那个网络承担。:
  • 可以看到,这个方法的PSNR确实不高,但是视觉效果真的很好,泛化性感觉也不错:


  • 如果要一言以蔽之,这个工作可以说是controlnet的restoration 特供版,不过确实做得不错,可惜没看到有开源。
相关推荐
EmpressBoost1 小时前
ElasticSearch学习笔记
笔记·学习·elasticsearch
笑衬人心。4 小时前
ThreadLocal 在 Spring 与数据库交互中的应用笔记
数据库·笔记·spring
费费开心一点6 小时前
Java程序设计学习笔记
java·笔记·学习
haidizym8 小时前
(笔记+作业)第五期书生大模型实战营---L2G2000 GraphGen:训练数据合成实践
笔记·大模型·知识图谱
Eli_Optics10 小时前
《通信原理》学习笔记——第三章
笔记·学习
麟城Lincoln11 小时前
【Linux-云原生-笔记】LVS(Linux virual server)相关
linux·笔记·云原生·lvs·nat·dr·ipvsadm
饕餮争锋12 小时前
设计模式笔记_结构型_装饰器模式
笔记·设计模式·装饰器模式
Ronin-Lotus12 小时前
上位机知识篇---Prompt&PowerShell Prompt
prompt·powershell
张较瘦_15 小时前
[论文阅读] 人工智能 + 软件工程 | 单会话方法论:一种以人类为中心的人工智能辅助软件开发协议
论文阅读·人工智能·软件工程
火山引擎开发者社区17 小时前
Prompt Engineering 快速入门+实战案例
人工智能·prompt