论文阅读:SIMPLE ZERO-SHOT IMAGE DEHAZING

作者:J.L. Lisani, J. Navarro, U. Untzilla

机构:Universitat de les Illes Balears

来源会议:2025 IEEE International Conference on Image Processing (ICIP)

会议时间与地点:2025年9月14-17日,美国阿拉斯加州安克雷奇

一、研究动机

1.研究目标

这篇论文要解决的是 单幅图像去雾(single-image dehazing) 问题。也就是说,只输入一张有雾图像,希望恢复其清晰图像。论文首先指出,雾霾会造成光吸收和散射,使图像出现对比度下降、细节丢失等问题;其成像关系通常由经典大气散射模型描述:
大气散射模型

其中:

I(x):观测到的有雾图像

J(x):真实无雾图像

t(x):透射率图(transmission map)

A:全局大气光(atmospheric light)

2.过去方法

论文把去雾方法分成两大类:

(1)先验方法(prior-based)

这类方法不靠大规模训练,而是依赖手工设计的统计先验,比如:

暗通道先验 DCP

饱和度相关先验

颜色分布先验

边界约束等

它们的优点是解释性强、训练成本低,但存在一个问题就是:手工先验通常在复杂真实场景下不总成立。

(2)数据驱动方法

这类方法靠神经网络学习去雾规律。又可分为:

1.监督方法:用成对 hazy/clear 图像训练

2.半监督方法

3.弱监督方法

4.无监督方法

问题在于,真实世界中几乎不可能大量采集"同一场景真实有雾/无雾严格配对"的数据,因此很多方法都用合成雾图训练。但合成雾和真实雾存在分布差异,导致 domain shift(域偏移):在合成数据上训练得很好,拿到真实雾图时效果变差。

3.本文方法

这篇论文的baseline是2020年的 ZID(Zero-shot Image Dehazing 改进而来。ZID 的思想是:不用外部训练集,只用当前这张输入雾图自己来训练网络,再对它自己去雾。

它把有雾图看作三层纠缠结果:

清晰场景层 J

透射层 t

大气光层 A

然后用三个子网络去解纠缠:

J-Net:估计清晰图像

T-Net:估计透射率图

A-Net:估计大气光

原始 ZID 的优点:

1.不需要训练集

2.不受训练或测试分布不一致的严重影响

3.对真实图像更有潜力。但有工作指出它存在一个明显缺陷:结果会出现颜色失真和伪影。

4.优势以及创新点

1.4 本文的核心创新

作者提出的改进版叫 SZID,核心创新有三点:

创新 1:简化 A-Net

原 ZID 的 A-Net 是 VAE(变分自编码器) 结构,而本文直接把它换成 回归网络 ,输出一个常量颜色图像 A,即整张图的每个像素共享同一个 RGB 大气光值。

这一步很关键,因为从物理模型上看,AAA 本来就是全局大气光,设成全局常量其实更合理。原方法把它建模得过于复杂,反而更容易估计错。

创新 2:去掉原 A-Net 的 hint 训练步骤

原 ZID 中,A-Net 训练要额外用一个从 hazy image 提取出来的hint。SZID 直接删掉了这一步。这意味着结构更简、依赖更少、训练更干净。

创新 3:提出新的颜色约束损失

作者新增了 角度损失 LAngular,目标是保持输入雾图与输出去雾图在颜色方向上的一致性,从而减少颜色漂移。

创新 4:模型大精简

作者报告SZID相比原始ZID参数量减少 95%,同时运行时间也显著下降。

二、算法主要思想与原理详解

SZID的主要架构图

三、实验结果

3.1 数据集

论文用了四类数据:

(1)SOTS

合成有雾数据集,分为:500 张室内500 张室外

(2)I-HAZE

真实室内雾图,共 30 张,用造雾设备生成,同时有清晰真值图。

(3)O-HAZE

真实室外雾图,共 45 张,同样有清晰真值图。

(4)DHQ

250 张真实雾图,没有清晰真值。

额外设置

I-HAZE 和 O-HAZE 为了降低计算成本,被缩放到最大边 1000 像素。

四.定性试验

I-HAZE数据集中单幅图像的结果
I-HAZE数据集中单幅图像的结果

五、消融实验

基于I-HAZE数据集的消融研究

六、结论

1.在合成数据上,SZID 并非最强

2.在真实数据上,它优于大多数只依赖合成训练的学习方法

3.相比原始 ZID,SZID 在颜色自然性、伪影控制、参数量和时间上都有明显改进

一个疑问:

为什么舍弃VAE(变分自编码器)?

优势:回归网络直接输出恒定大气光,参数量少(减少95%),稳定性高,避免颜色伪影;无需采样,推理更快。

联系:两者均用于估计大气光,作为物理模型的输入。

区别:VAE为生成式,输出随输入变化且具随机性;回归网络为判别式,输出单一确定性常数

相关推荐
Chunyyyen1 天前
【第四十四周】论文阅读
论文阅读
数智工坊2 天前
【扩散模型超分开山之作】:SR3扩散模型核心原理与全链路解析
论文阅读·人工智能·深度学习·transformer·迁移学习
数智工坊2 天前
基于CLIP隐空间的层级文本条件图像生成:unCLIP核心原理与全链路解析
论文阅读·人工智能·深度学习·transformer·迁移学习
QFIUNE2 天前
【文献阅读】化学空间边缘的分子深度学习
论文阅读·人工智能·笔记·深度学习
数智工坊3 天前
ControlNet:为文生图扩散模型注入精准空间条件控制
论文阅读·人工智能·深度学习·transformer·迁移学习
莽撞的大地瓜3 天前
校对通更新!告别反复转格式 PDF图文/扫描件一键校对
论文阅读·新媒体运营·内容运营
Ma0407134 天前
SCI投稿
论文阅读
数智工坊4 天前
【DDIM 论文阅读】:扩散模型加速采样的里程碑!10~50 倍快采 + 确定性生成
论文阅读·人工智能·深度学习·cnn·transformer
数智工坊5 天前
【VAE 论文阅读| ICLR 2014】:变分自编码器——深度生成模型的理论基石
论文阅读·人工智能·深度学习
数智工坊6 天前
【ECNDNet论文阅读|图像去噪经典】:融合残差、BN与空洞卷积的增强型去噪网络
网络·论文阅读