ICCV 2025 | 去模糊新范式!残差引导 + 图像金字塔,强噪声下核估计精度提升 77%,SOTA 到手

在低光照摄影或长曝光拍摄中,我们常常面临一个棘手问题:图像不仅模糊,还充斥着大量噪声。传统盲去模糊方法在这种情况下往往"束手无策"------要么过度平滑丢失细节,要么保留噪声导致图像失真。ICCV 2025最新研究《Blind Noisy Image Deblurring Using Residual Guidance Strategy》提出的残差引导策略(RGS),为解决这一难题提供了突破性方案。

论文信息

题目:Blind Noisy Image Deblurring Using Residual Guidance Strategy
基于残差引导策略的盲去噪图像去模糊
作者:Heyan Liu、Jianing Sun、Jun Liu、Xi - Le Zhao、Tingting Wu、Tieyong Zeng

为何传统方法在噪声面前失效?

盲图像去模糊的核心挑战在于:从单张模糊图像中同时恢复清晰图像和模糊核。当图像存在强噪声时,这个问题变得更加复杂。

如图所示,随着噪声水平提高(σ从0.01到0.1),传统方法估计的模糊核逐渐失真甚至完全崩溃。这是因为:

  • 噪声会干扰模糊核的准确估计

  • 去模糊与去噪之间存在难以平衡的矛盾

  • 高分辨率尺度下噪声被放大,进一步影响恢复质量

残差引导策略:跨尺度信息的智能利用

论文的核心创新在于提出了残差引导策略(RGS),通过图像金字塔中不同尺度的信息交互,实现噪声抑制与细节保留的平衡。

方法总体框架

残差引导策略的总体框架

整个方法采用由粗到精的处理流程:

  1. 构建模糊图像的金字塔结构(从粗到细多个尺度)

  2. 在最粗尺度初始化模糊核估计

  3. 利用残差引导策略跨尺度传递信息

  4. 逐步细化每个尺度的模糊核

  5. 最终通过非盲去模糊获得清晰图像

残差引导的核心机制

残差引导策略的工作原理

RGS的关键步骤包括:

  1. 残差计算:计算当前尺度模糊图像与上一尺度估计结果的差异(包含噪声和细节)

    • 残差 = 原始模糊图像 - 上一尺度结果的上采样
  2. 残差滤波:使用引导滤波器对残差进行平滑,保留结构信息同时抑制噪声

  3. 图像校正:用处理后的残差校正当前尺度的模糊图像

  4. 核估计优化:基于校正后的图像迭代优化模糊核

这种设计的巧妙之处在于:它不直接对原始图像去噪,而是通过处理残差来平衡去模糊与去噪,既避免了过度平滑,又能有效抑制噪声。

实验结果:全面超越现有方法

研究团队在四个权威数据集(Lai、Levin、人脸图像、Realblur)上进行了大量实验,从定量和定性两方面验证了方法的优越性。

定量指标领先

在PSNR(峰值信噪比)、SSIM(结构相似性)、LPIPS(感知相似性)和MNC(核相似性)等指标上,该方法均显著领先于现有方法:

  • PSNR平均提升1-2dB

  • SSIM提升0.03-0.05

  • LPIPS降低0.05-0.1(数值越低越好)

  • MNC更接近1(表示估计核与真实核更相似)

视觉效果对比

不同方法的去模糊结果对比

从图中可以清晰看到:

  • 传统方法(b-c)和深度学习方法(d-h)要么保留大量噪声,要么产生明显伪影

  • 本文方法(i)能够同时去除模糊和噪声,保留更多细节(如建筑结构和车辆纹理)

真实场景表现

真实世界图像去模糊结果

在Realblur真实数据集上,该方法成功解决了其他方法产生的振铃伪影问题,尤其在处理图像角落的文字和数字时表现出色。

残差引导策略的普适性

该研究的另一个重要发现是:RGS可以作为"插件"增强其他去模糊方法的抗噪声能力。

RGS对其他方法的性能提升

将RGS应用于Dong等人的方法后:

  • 模糊核估计更接近真实值

  • 去模糊结果的纹理细节更丰富

  • 噪声抑制效果显著提升

这种普适性意味着RGS可以广泛应用于现有方法,推动整个领域在噪声鲁棒性方面的进步。

为什么无需训练却能超越深度学习方法?

与深度学习方法相比,该方法具有三大优势:

  1. 无需大规模训练数据:避免了数据驱动方法对数据集的依赖

  2. 计算成本更低:不需要复杂的神经网络推理过程

  3. 可解释性强:基于明确的物理模型和数学原理

不同噪声水平下的稳定性验证

100次重复实验的低方差结果(PSNR方差5.1×10⁻³)证明了方法的稳定性和可靠性。

总结与展望

这项研究通过创新性的残差引导策略,在盲去模糊领域实现了三个突破:

  1. 提出了抗噪声的盲去模糊框架,解决了强噪声下核估计失真问题

  2. 设计了可迁移的残差引导策略,能增强多种现有方法的性能

  3. 在无需训练的情况下,实现了对深度学习方法的超越

未来,研究团队计划探索更强大的滤波器替代方案,进一步提升在极端噪声条件下的处理能力。这一工作为解决实际场景中的盲去模糊问题提供了新的思路,有望在监控摄像、夜间摄影、医学影像等领域得到广泛应用。

相关推荐
大模型真好玩18 小时前
LangChain DeepAgents 速通指南(三)—— 让Agent告别混乱:Tool Selector与Todo List中间件解析
人工智能·langchain·trae
孟祥_成都19 小时前
【全网最通俗!新手到AI全栈开发必读】 AI 是如何进化到大模型的
前端·人工智能·全栈
牛奶19 小时前
AI辅助开发的基础概念
前端·人工智能·ai编程
东坡肘子19 小时前
OpenClaw 不错,但我好像没有那么需要 -- 肘子的 Swift 周报 #125
人工智能·swiftui·swift
风象南1 天前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶1 天前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶1 天前
前端人为什么要学AI?
前端·人工智能·ai编程
罗西的思考1 天前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab1 天前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab1 天前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯