论文阅读:SIMPLE ZERO-SHOT IMAGE DEHAZING

作者:J.L. Lisani, J. Navarro, U. Untzilla

机构:Universitat de les Illes Balears

来源会议:2025 IEEE International Conference on Image Processing (ICIP)

会议时间与地点:2025年9月14-17日,美国阿拉斯加州安克雷奇

一、研究动机

1.研究目标

这篇论文要解决的是 单幅图像去雾(single-image dehazing) 问题。也就是说,只输入一张有雾图像,希望恢复其清晰图像。论文首先指出,雾霾会造成光吸收和散射,使图像出现对比度下降、细节丢失等问题;其成像关系通常由经典大气散射模型描述:
大气散射模型

其中:

I(x):观测到的有雾图像

J(x):真实无雾图像

t(x):透射率图(transmission map)

A:全局大气光(atmospheric light)

2.过去方法

论文把去雾方法分成两大类:

(1)先验方法(prior-based)

这类方法不靠大规模训练,而是依赖手工设计的统计先验,比如:

暗通道先验 DCP

饱和度相关先验

颜色分布先验

边界约束等

它们的优点是解释性强、训练成本低,但存在一个问题就是:手工先验通常在复杂真实场景下不总成立。

(2)数据驱动方法

这类方法靠神经网络学习去雾规律。又可分为:

1.监督方法:用成对 hazy/clear 图像训练

2.半监督方法

3.弱监督方法

4.无监督方法

问题在于,真实世界中几乎不可能大量采集"同一场景真实有雾/无雾严格配对"的数据,因此很多方法都用合成雾图训练。但合成雾和真实雾存在分布差异,导致 domain shift(域偏移):在合成数据上训练得很好,拿到真实雾图时效果变差。

3.本文方法

这篇论文的baseline是2020年的 ZID(Zero-shot Image Dehazing 改进而来。ZID 的思想是:不用外部训练集,只用当前这张输入雾图自己来训练网络,再对它自己去雾。

它把有雾图看作三层纠缠结果:

清晰场景层 J

透射层 t

大气光层 A

然后用三个子网络去解纠缠:

J-Net:估计清晰图像

T-Net:估计透射率图

A-Net:估计大气光

原始 ZID 的优点:

1.不需要训练集

2.不受训练或测试分布不一致的严重影响

3.对真实图像更有潜力。但有工作指出它存在一个明显缺陷:结果会出现颜色失真和伪影。

4.优势以及创新点

1.4 本文的核心创新

作者提出的改进版叫 SZID,核心创新有三点:

创新 1:简化 A-Net

原 ZID 的 A-Net 是 VAE(变分自编码器) 结构,而本文直接把它换成 回归网络 ,输出一个常量颜色图像 A,即整张图的每个像素共享同一个 RGB 大气光值。

这一步很关键,因为从物理模型上看,AAA 本来就是全局大气光,设成全局常量其实更合理。原方法把它建模得过于复杂,反而更容易估计错。

创新 2:去掉原 A-Net 的 hint 训练步骤

原 ZID 中,A-Net 训练要额外用一个从 hazy image 提取出来的hint。SZID 直接删掉了这一步。这意味着结构更简、依赖更少、训练更干净。

创新 3:提出新的颜色约束损失

作者新增了 角度损失 LAngular,目标是保持输入雾图与输出去雾图在颜色方向上的一致性,从而减少颜色漂移。

创新 4:模型大精简

作者报告SZID相比原始ZID参数量减少 95%,同时运行时间也显著下降。

二、算法主要思想与原理详解

SZID的主要架构图

三、实验结果

3.1 数据集

论文用了四类数据:

(1)SOTS

合成有雾数据集,分为:500 张室内500 张室外

(2)I-HAZE

真实室内雾图,共 30 张,用造雾设备生成,同时有清晰真值图。

(3)O-HAZE

真实室外雾图,共 45 张,同样有清晰真值图。

(4)DHQ

250 张真实雾图,没有清晰真值。

额外设置

I-HAZE 和 O-HAZE 为了降低计算成本,被缩放到最大边 1000 像素。

四.定性试验

I-HAZE数据集中单幅图像的结果
I-HAZE数据集中单幅图像的结果

五、消融实验

基于I-HAZE数据集的消融研究

六、结论

1.在合成数据上,SZID 并非最强

2.在真实数据上,它优于大多数只依赖合成训练的学习方法

3.相比原始 ZID,SZID 在颜色自然性、伪影控制、参数量和时间上都有明显改进

一个疑问:

为什么舍弃VAE(变分自编码器)?

优势:回归网络直接输出恒定大气光,参数量少(减少95%),稳定性高,避免颜色伪影;无需采样,推理更快。

联系:两者均用于估计大气光,作为物理模型的输入。

区别:VAE为生成式,输出随输入变化且具随机性;回归网络为判别式,输出单一确定性常数

相关推荐
西柚小萌新5 小时前
【论文阅读】--A Comprehensive Survey on Multimodal Retrieval-Augmented Generation
论文阅读
诸神缄默不语5 小时前
论文阅读笔记:Claude如何思考
论文阅读·笔记·大模型·llm·大语言模型·claude·大规模预训练语言模型
冰西瓜6006 小时前
论文阅读——TurboQuant:破解大模型推理内存墙的近最优量化方案
论文阅读
CV-杨帆6 小时前
论文阅读:ACL 2025 PaSa: An LLM Agent for Comprehensive Academic Paper Search
论文阅读
智算菩萨21 小时前
【论文精读】Automated machine learning for positive-unlabelled learning
论文阅读·人工智能·机器学习·论文笔记·贝叶斯优化·自动机器学习·无标签学习
数说星榆1811 天前
电脑流程图模板精选 中文适配一键修改超方便
论文阅读·毕业设计·流程图·论文笔记·毕设
movigo7_dou1 天前
SIFT的一些内容
论文阅读·图像处理·学习·计算机视觉
QiZhang | UESTC2 天前
《Attention is all you need》论文阅读与代码实战
论文阅读
STLearner2 天前
AI论文速读 | 元认知监控赋能深度搜索:认知神经科学启发的分层优化框架
大数据·论文阅读·人工智能·python·深度学习·学习·机器学习