SPIRE: Semantic Prompt-Driven Image Restoration 论文阅读笔记

  • 这是一篇港科大学生在google research 实习期间发在ECCV2024的语义引导生成式修复的文章,港科大陈启峰也挂了名字。从首页图看效果确实很惊艳,尤其是第三行能用文本调控修复结果牌上的字。不过看起来更倾向于生成,对原图内容并不是很复原(不过在生成式方法中已经做得很好了),适合超级噪声图这种原图信息丢失十分严重的场景:
  • 整体方法流程如下图所示,用的是stable diffusion的框架,甚至模型参数都是pretrain好后fix住的,在此之上,用controlnet的风格添加了另外一部分网络,来接收restoration的描述和degraded image,网络中的feature来调制这个train好的stable diffusion的unet中的feature,然后是可train的:
  • 现在diffusion有了两个目标,一个是原有的stable diffusion在denoise的过程中还是文本梯度,另一个是最终生成的图片要和输入的LQ图片内容一致,而这部分梯度分开由需要train的那个网络承担。:
  • 可以看到,这个方法的PSNR确实不高,但是视觉效果真的很好,泛化性感觉也不错:


  • 如果要一言以蔽之,这个工作可以说是controlnet的restoration 特供版,不过确实做得不错,可惜没看到有开源。
相关推荐
万事可爱^1 小时前
LangChain v1.0学习笔记(4)—— 核心组件Models
人工智能·笔记·学习·langchain·大模型
饭勺oO1 小时前
AI 编程配置太头疼?ACP 帮你一键搞定,再也不用反复折腾!
ai·prompt·agent·acp·mcp·skills·agent skill
卡布叻_星星1 小时前
笔记之光盘刻录
笔记
寄思~1 小时前
Excel 数据匹配工具 -笔记
笔记·python·学习·excel
数据轨迹0012 小时前
CVPR Efficient ViM:视觉 Mamba 的轻量化
经验分享·笔记·facebook·oneapi·twitter
wdfk_prog2 小时前
WIN11如何可以安装ISO
linux·笔记·学习
haokan_Jia2 小时前
【高项十大知识域-重点笔记】
笔记
中屹指纹浏览器3 小时前
中屹指纹浏览器的IP-指纹协同适配技术架构与实现原理
经验分享·笔记
崎岖Qiu4 小时前
【OS笔记40】:设备管理 - 通道控制方式
笔记·操作系统·dma·os
自不量力的A同学4 小时前
Midjourney 推出面向动漫领域的图像生成模型:Niji V7
笔记