论文阅读：SIMPLE ZERO-SHOT IMAGE DEHAZING

作者：J.L. Lisani, J. Navarro, U. Untzilla

机构：Universitat de les Illes Balears

来源会议：2025 IEEE International Conference on Image Processing (ICIP)

会议时间与地点：2025年9月14-17日，美国阿拉斯加州安克雷奇

一、研究动机

1.研究目标

这篇论文要解决的是 单幅图像去雾（single-image dehazing） 问题。也就是说，只输入一张有雾图像，希望恢复其清晰图像。论文首先指出，雾霾会造成光吸收和散射，使图像出现对比度下降、细节丢失等问题；其成像关系通常由经典大气散射模型描述：
大气散射模型

其中：

I(x)：观测到的有雾图像

J(x)：真实无雾图像

t(x)：透射率图（transmission map）

A：全局大气光（atmospheric light）

2.过去方法

论文把去雾方法分成两大类：

（1）先验方法（prior-based）

这类方法不靠大规模训练，而是依赖手工设计的统计先验，比如：

暗通道先验 DCP

饱和度相关先验

颜色分布先验

边界约束等

它们的优点是解释性强、训练成本低，但存在一个问题就是：手工先验通常在复杂真实场景下不总成立。

（2）数据驱动方法

这类方法靠神经网络学习去雾规律。又可分为：

1.监督方法：用成对 hazy/clear 图像训练

2.半监督方法

3.弱监督方法

4.无监督方法

问题在于，真实世界中几乎不可能大量采集"同一场景真实有雾/无雾严格配对"的数据，因此很多方法都用合成雾图训练。但合成雾和真实雾存在分布差异，导致 domain shift（域偏移）：在合成数据上训练得很好，拿到真实雾图时效果变差。

3.本文方法

这篇论文的baseline是2020年的 ZID（Zero-shot Image Dehazing 改进而来。ZID 的思想是：不用外部训练集，只用当前这张输入雾图自己来训练网络，再对它自己去雾。

它把有雾图看作三层纠缠结果：

清晰场景层 J

透射层 t

大气光层 A

然后用三个子网络去解纠缠：

J-Net：估计清晰图像

T-Net：估计透射率图

A-Net：估计大气光

原始 ZID 的优点：

1.不需要训练集

2.不受训练或测试分布不一致的严重影响

3.对真实图像更有潜力。但有工作指出它存在一个明显缺陷：结果会出现颜色失真和伪影。

4.优势以及创新点

1.4 本文的核心创新

作者提出的改进版叫 SZID，核心创新有三点：

创新 1：简化 A-Net

原 ZID 的 A-Net 是 VAE（变分自编码器） 结构，而本文直接把它换成 回归网络 ，输出一个常量颜色图像 A，即整张图的每个像素共享同一个 RGB 大气光值。

这一步很关键，因为从物理模型上看，AAA 本来就是全局大气光，设成全局常量其实更合理。原方法把它建模得过于复杂，反而更容易估计错。

创新 2：去掉原 A-Net 的 hint 训练步骤

原 ZID 中，A-Net 训练要额外用一个从 hazy image 提取出来的hint。SZID 直接删掉了这一步。这意味着结构更简、依赖更少、训练更干净。

创新 3：提出新的颜色约束损失

作者新增了 角度损失 LAngular，目标是保持输入雾图与输出去雾图在颜色方向上的一致性，从而减少颜色漂移。

创新 4：模型大精简

作者报告SZID相比原始ZID参数量减少 95%，同时运行时间也显著下降。

二、算法主要思想与原理详解

SZID的主要架构图

三、实验结果

3.1 数据集

论文用了四类数据：

（1）SOTS

合成有雾数据集，分为：500 张室内500 张室外

（2）I-HAZE

真实室内雾图，共 30 张，用造雾设备生成，同时有清晰真值图。

（3）O-HAZE

真实室外雾图，共 45 张，同样有清晰真值图。

（4）DHQ

250 张真实雾图，没有清晰真值。

额外设置

I-HAZE 和 O-HAZE 为了降低计算成本，被缩放到最大边 1000 像素。

四.定性试验

I-HAZE数据集中单幅图像的结果
I-HAZE数据集中单幅图像的结果

五、消融实验

基于I-HAZE数据集的消融研究

六、结论

1.在合成数据上，SZID 并非最强

2.在真实数据上，它优于大多数只依赖合成训练的学习方法

3.相比原始 ZID，SZID 在颜色自然性、伪影控制、参数量和时间上都有明显改进

一个疑问：

为什么舍弃VAE（变分自编码器）？

优势：回归网络直接输出恒定大气光，参数量少（减少95%），稳定性高，避免颜色伪影；无需采样，推理更快。

联系：两者均用于估计大气光，作为物理模型的输入。

区别：VAE为生成式，输出随输入变化且具随机性；回归网络为判别式，输出单一确定性常数