作者:J.L. Lisani, J. Navarro, U. Untzilla
机构:Universitat de les Illes Balears
来源会议:2025 IEEE International Conference on Image Processing (ICIP)
会议时间与地点:2025年9月14-17日,美国阿拉斯加州安克雷奇
一、研究动机
1.研究目标
这篇论文要解决的是 单幅图像去雾(single-image dehazing) 问题。也就是说,只输入一张有雾图像,希望恢复其清晰图像。论文首先指出,雾霾会造成光吸收和散射,使图像出现对比度下降、细节丢失等问题;其成像关系通常由经典大气散射模型描述:
大气散射模型
其中:
I(x):观测到的有雾图像
J(x):真实无雾图像
t(x):透射率图(transmission map)
A:全局大气光(atmospheric light)
2.过去方法
论文把去雾方法分成两大类:
(1)先验方法(prior-based)
这类方法不靠大规模训练,而是依赖手工设计的统计先验,比如:
暗通道先验 DCP
饱和度相关先验
颜色分布先验
边界约束等
它们的优点是解释性强、训练成本低,但存在一个问题就是:手工先验通常在复杂真实场景下不总成立。
(2)数据驱动方法
这类方法靠神经网络学习去雾规律。又可分为:
1.监督方法:用成对 hazy/clear 图像训练
2.半监督方法
3.弱监督方法
4.无监督方法
问题在于,真实世界中几乎不可能大量采集"同一场景真实有雾/无雾严格配对"的数据,因此很多方法都用合成雾图训练。但合成雾和真实雾存在分布差异,导致 domain shift(域偏移):在合成数据上训练得很好,拿到真实雾图时效果变差。
3.本文方法
这篇论文的baseline是2020年的 ZID(Zero-shot Image Dehazing 改进而来。ZID 的思想是:不用外部训练集,只用当前这张输入雾图自己来训练网络,再对它自己去雾。
它把有雾图看作三层纠缠结果:
清晰场景层 J
透射层 t
大气光层 A
然后用三个子网络去解纠缠:
J-Net:估计清晰图像
T-Net:估计透射率图
A-Net:估计大气光
原始 ZID 的优点:
1.不需要训练集
2.不受训练或测试分布不一致的严重影响
3.对真实图像更有潜力。但有工作指出它存在一个明显缺陷:结果会出现颜色失真和伪影。
4.优势以及创新点
1.4 本文的核心创新
作者提出的改进版叫 SZID,核心创新有三点:
创新 1:简化 A-Net
原 ZID 的 A-Net 是 VAE(变分自编码器) 结构,而本文直接把它换成 回归网络 ,输出一个常量颜色图像 A,即整张图的每个像素共享同一个 RGB 大气光值。
这一步很关键,因为从物理模型上看,AAA 本来就是全局大气光,设成全局常量其实更合理。原方法把它建模得过于复杂,反而更容易估计错。
创新 2:去掉原 A-Net 的 hint 训练步骤
原 ZID 中,A-Net 训练要额外用一个从 hazy image 提取出来的hint。SZID 直接删掉了这一步。这意味着结构更简、依赖更少、训练更干净。
创新 3:提出新的颜色约束损失
作者新增了 角度损失 LAngular,目标是保持输入雾图与输出去雾图在颜色方向上的一致性,从而减少颜色漂移。
创新 4:模型大精简
作者报告SZID相比原始ZID参数量减少 95%,同时运行时间也显著下降。
二、算法主要思想与原理详解
SZID的主要架构图
三、实验结果
3.1 数据集
论文用了四类数据:
(1)SOTS
合成有雾数据集,分为:500 张室内500 张室外
(2)I-HAZE
真实室内雾图,共 30 张,用造雾设备生成,同时有清晰真值图。
(3)O-HAZE
真实室外雾图,共 45 张,同样有清晰真值图。
(4)DHQ
250 张真实雾图,没有清晰真值。
额外设置
I-HAZE 和 O-HAZE 为了降低计算成本,被缩放到最大边 1000 像素。
四.定性试验
I-HAZE数据集中单幅图像的结果
I-HAZE数据集中单幅图像的结果
五、消融实验
基于I-HAZE数据集的消融研究
六、结论
1.在合成数据上,SZID 并非最强
2.在真实数据上,它优于大多数只依赖合成训练的学习方法
3.相比原始 ZID,SZID 在颜色自然性、伪影控制、参数量和时间上都有明显改进
一个疑问:
为什么舍弃VAE(变分自编码器)?
优势:回归网络直接输出恒定大气光,参数量少(减少95%),稳定性高,避免颜色伪影;无需采样,推理更快。
联系:两者均用于估计大气光,作为物理模型的输入。
区别:VAE为生成式,输出随输入变化且具随机性;回归网络为判别式,输出单一确定性常数