▒▒本文目录▒▒
-
- 摘要
- 一、研究背景
-
- [1.1 散射介质成像的挑战](#1.1 散射介质成像的挑战)
- [1.2 现有方法的局限性](#1.2 现有方法的局限性)
- [1.3 扩散模型的兴起](#1.3 扩散模型的兴起)
- 二、研究方法
-
- [2.1 扩散模型理论基础](#2.1 扩散模型理论基础)
-
- [2.1.1 前向扩散过程](#2.1.1 前向扩散过程)
- [2.1.2 反向扩散采样](#2.1.2 反向扩散采样)
- [2.2 分数网络架构](#2.2 分数网络架构)
- [2.3 训练策略](#2.3 训练策略)
-
- [2.3.1 分数匹配损失](#2.3.1 分数匹配损失)
- [2.3.2 指数移动平均](#2.3.2 指数移动平均)
- [2.4 采样策略](#2.4 采样策略)
-
- [2.4.1 预测-校正采样器](#2.4.1 预测-校正采样器)
- [2.4.2 数据一致性约束](#2.4.2 数据一致性约束)
- 三、具体实现细节
-
- [3.1 VESDE实现](#3.1 VESDE实现)
- [3.2 网络配置](#3.2 网络配置)
- [3.3 采样配置](#3.3 采样配置)
- [3.4 图像重建流程](#3.4 图像重建流程)
- 四、实验结果与分析
-
- [4.1 重建结果展示](#4.1 重建结果展示)
- [4.2 结果分析](#4.2 结果分析)
-
- [4.2.1 扩散采样过程分析](#4.2.1 扩散采样过程分析)
- [4.2.2 与传统方法对比](#4.2.2 与传统方法对比)
- [4.2.3 不同分辨率靶的重建效果](#4.2.3 不同分辨率靶的重建效果)
- [4.3 方法优势分析](#4.3 方法优势分析)
- 五、讨论与展望
-
- [5.1 当前方法的局限](#5.1 当前方法的局限)
- [5.2 未来研究方向](#5.2 未来研究方向)
- 六、结论
- 参考文献
- 程序开发
摘要
散射介质成像是一项具有重大科学意义和广泛应用前景的技术挑战。当光波通过散射介质(如雾、生物组织、磨砂玻璃等)时,会发生多重散射现象,导致原始图像信息被严重破坏,形成随机散斑图样。本研究探讨了一种基于生成扩散模型的散射介质成像重建方法(ISDM),通过训练深度神经网络学习图像的分数函数,利用反向扩散采样过程从散斑图像中恢复原始目标图像。该方法采用方差爆炸随机微分方程(VESDE)建模前向扩散过程,使用NCSN++网络架构估计分数函数,结合预测-校正采样策略和数据一致性约束实现高质量图像重建。实验结果表明,与传统方法相比,该方法在保持结构细节和抑制噪声方面具有显著优势,为散射介质成像提供了一种有效的深度学习解决方案。
关键词: 扩散模型,散射成像,分数匹配,随机微分方程,深度学习
一、研究背景
1.1 散射介质成像的挑战
散射介质成像在生物医学成像、遥感探测、水下视觉等领域具有重要的应用价值。然而,当光波穿过散射介质时,会发生复杂的散射现象:
- 多重散射效应:光子与散射介质中的微粒发生多次碰撞,导致传播方向随机改变
- 相位随机化:散射介质的折射率不均匀导致光波相位发生随机变化
- 信息编码:原始图像信息被编码到复杂的散斑图样中

图1:散射成像系统示意图。光源发出的光经过目标物体后被散射介质调制,形成散斑图样被探测器接收。
1.2 现有方法的局限性
传统的散射介质成像重建方法主要包括:
| 方法类型 | 代表算法 | 主要优点 | 存在局限 |
|---|---|---|---|
| 直接反演法 | 逆矩阵法 | 计算简单 | 对噪声敏感,不适定性 |
| 迭代优化法 | HIO算法 | 约束灵活 | 收敛慢,易陷入局部最优 |
| 正则化方法 | TV正则化 | 边缘保持 | 参数敏感,纹理丢失 |
| 深度学习方法 | CNN/U-Net | 端到端学习 | 泛化能力有限 |
1.3 扩散模型的兴起
近年来,基于分数的生成模型在图像生成领域取得了突破性进展:
- Score Matching:Song等人提出通过估计数据分布梯度(分数)来生成样本
- 扩散概率模型:Ho等人提出的DDPM展示了优秀的图像生成能力
- 随机微分方程框架:统一了多种生成模型,提供了灵活的训练和采样策略

图2:ISDM训练与重建流程图。训练阶段学习从清晰图像到噪声的扩散过程,重建阶段利用学习的分数函数进行反向采样。
二、研究方法
2.1 扩散模型理论基础
2.1.1 前向扩散过程
本研究采用方差爆炸随机微分方程(VESDE)描述前向扩散过程:
d x = σ ( t ) d w dx = \sigma(t)dw dx=σ(t)dw
其中:
- x x x 表示图像状态
- σ ( t ) = σ m i n ( σ m a x / σ m i n ) t \sigma(t) = \sigma_{min}(\sigma_{max}/\sigma_{min})^t σ(t)=σmin(σmax/σmin)t 为噪声水平函数
- w w w 表示标准维纳过程
边际分布可解析表示为:
p t ( x ∣ x 0 ) = N ( x ; x 0 , σ ( t ) 2 I ) p_t(x|x_0) = \mathcal{N}(x; x_0, \sigma(t)^2 I) pt(x∣x0)=N(x;x0,σ(t)2I)

图3:VESDE噪声演化过程。左图展示噪声水平σ(t)随时间呈指数增长;中图展示不同时间步的边际分布逐渐展宽;右图展示反向采样轨迹。
2.1.2 反向扩散采样
反向时间SDE可表示为:
d x = [ f ( x , t ) − g 2 ( t ) ∇ x log p t ( x ) ] d t + g ( t ) d w ˉ dx = [f(x,t) - g^2(t)\nabla_x \log p_t(x)]dt + g(t)d\bar{w} dx=[f(x,t)−g2(t)∇xlogpt(x)]dt+g(t)dwˉ
其中 ∇ x log p t ( x ) \nabla_x \log p_t(x) ∇xlogpt(x) 称为分数函数,需要通过神经网络估计。
2.2 分数网络架构
本研究采用NCSN++(Noise Conditional Score Network++)作为分数估计网络:

图4:NCSN++网络架构。采用U-Net结构,包含编码器-解码器、跳跃连接和注意力机制。
网络特点:
- 高斯傅里叶嵌入:将时间/噪声水平编码为高维特征
- 渐进式结构:多尺度特征提取,在16×16分辨率加入注意力机制
- BigGAN残差块:增强梯度流动,提高训练稳定性
- 跳跃连接:保留细节信息,改善重建质量
2.3 训练策略
2.3.1 分数匹配损失
采用去噪分数匹配目标函数:
L = E t , x 0 , ϵ [ λ ( t ) ∥ ∇ x log p t ( x ∣ x 0 ) − s θ ( x , t ) ∥ 2 ] \mathcal{L} = \mathbb{E}{t,x_0,\epsilon}\left[\lambda(t)\|\nabla_x \log p_t(x|x_0) - s\theta(x,t)\|^2\right] L=Et,x0,ϵ[λ(t)∥∇xlogpt(x∣x0)−sθ(x,t)∥2]
其中权重函数:
λ ( t ) = 1 σ ( t ) 2 \lambda(t) = \frac{1}{\sigma(t)^2} λ(t)=σ(t)21

图5:分数匹配训练过程。左图展示训练损失随迭代次数下降;右图展示损失权重随时间的变化。
2.3.2 指数移动平均
为提高模型稳定性,采用EMA(Exponential Moving Average)更新网络参数:
θ E M A = β ⋅ θ E M A + ( 1 − β ) ⋅ θ \theta_{EMA} = \beta \cdot \theta_{EMA} + (1-\beta) \cdot \theta θEMA=β⋅θEMA+(1−β)⋅θ
其中衰减率 β = 0.999 \beta = 0.999 β=0.999。
2.4 采样策略
2.4.1 预测-校正采样器
采用Predictor-Corrector采样策略:
Predictor步骤(反向扩散预测器):
x t − Δ t = x t + [ f ( x t , t ) − g 2 ( t ) s θ ( x t , t ) ] Δ t + g ( t ) Δ t ϵ x_{t-\Delta t} = x_t + [f(x_t,t) - g^2(t)s_\theta(x_t,t)]\Delta t + g(t)\sqrt{\Delta t}\epsilon xt−Δt=xt+[f(xt,t)−g2(t)sθ(xt,t)]Δt+g(t)Δt ϵ
Corrector步骤(Langevin校正器):
x = x + α ⋅ s θ ( x , t ) + 2 α ϵ x = x + \alpha \cdot s_\theta(x,t) + \sqrt{2\alpha}\epsilon x=x+α⋅sθ(x,t)+2α ϵ
其中步长 α \alpha α 由信噪比(SNR)控制。
2.4.2 数据一致性约束
在采样过程中加入测量约束:
x = x + γ ( t ) ⋅ ( y m e a s u r e d − T ( x ) ) x = x + \gamma(t) \cdot (y_{measured} - T(x)) x=x+γ(t)⋅(ymeasured−T(x))
其中 γ ( t ) \gamma(t) γ(t) 为随时间递增的约束权重。
三、具体实现细节
3.1 VESDE实现
VESDE参数配置:
- sigma_min = 0.01
- sigma_max = 380
- 离散化步数 N = 1000
- 采样终止时间 eps = 1e-5
3.2 网络配置
NCSN++网络配置:
- 基础通道数 nf = 128
- 通道倍数 ch_mult = (1, 1, 2, 2, 2, 2, 2)
- 残差块数量 num_res_blocks = 2
- 注意力分辨率 attn_resolutions = (16,)
- 激活函数:Swish
- 归一化:GroupNorm
3.3 采样配置
采样参数:
- 方法:Predictor-Corrector
- 预测器:ReverseDiffusionPredictor
- 校正器:LangevinCorrector
- 信噪比 SNR = 0.16
- 每步校正次数 n_steps = 1
3.4 图像重建流程

图6:ISDM算法流程示意图。输入图像经过散射介质形成散斑图样,分数网络估计梯度信息,通过反向扩散采样重建原始图像。
重建步骤:
- 加载预训练的分数网络模型
- 读取散射介质后的散斑图像
- 从先验分布采样初始噪声图像
- 执行1000步反向扩散采样
- 在每步加入数据一致性约束
- TV去噪后处理优化结果
四、实验结果与分析
4.1 重建结果展示

图7:ISDM图像重建结果。第一行从左至右依次为:原始图像、散射后散斑图像、ISDM重建结果、重建误差图;第二行展示扩散采样过程从纯噪声逐步恢复图像;第三行展示图像范数变化和算法流程。
4.2 结果分析
4.2.1 扩散采样过程分析
从图7的采样过程可视化可以观察到:
- 初始阶段(t≈1.0):图像处于纯噪声状态,无明显结构信息
- 中间阶段(t≈0.5-0.7):开始出现模糊的轮廓和结构
- 后期阶段(t≈0.1-0.3):细节逐渐清晰,噪声被有效抑制
- 最终阶段(t≈0):获得高质量重建图像
4.2.2 与传统方法对比

图8:不同方法的重建结果对比。(a)USAF分辨率靶,(b)散斑图像,©LR方法,(d)HIO方法,(e)TC方法,(f)ISDM方法。
从对比结果可以看出:
- LR方法:重建结果模糊,分辨率低
- HIO方法:存在伪影,边缘不够锐利
- TC方法:部分细节丢失
- ISDM方法:保持最佳的结构细节和边缘清晰度
4.2.3 不同分辨率靶的重建效果
| 目标 | 分辨率特征 | ISDM PSNR(dB) | ISDM SSIM | 可辨认程度 |
|---|---|---|---|---|
| G1E2 | 粗条纹 | 28.5 | 0.92 | 完全清晰 |
| G1E6 | 中等条纹 | 25.3 | 0.88 | 清晰可辨 |
| G2E5 | 细条纹 | 22.1 | 0.82 | 基本可辨 |
| G3E2 | 极细条纹 | 18.7 | 0.75 | 部分可辨 |
4.3 方法优势分析
1. 生成式建模优势
- 学习数据分布而非直接映射
- 能够处理不适定逆问题
- 生成多样化的合理解
2. 渐进式采样优势
- 从粗到细的重建过程
- 自然地结合多尺度信息
- 避免局部最优陷阱
3. 数据一致性约束优势
- 充分利用测量信息
- 提高重建准确性
- 增强物理可解释性
五、讨论与展望
5.1 当前方法的局限
- 计算效率:1000步采样过程耗时较长,需要优化采样策略
- 训练数据依赖:需要大量配对的训练数据
- 泛化能力:对不同散射介质的适应性有待验证
5.2 未来研究方向
- 加速采样:研究一致性模型、蒸馏技术等加速方法
- 零样本/少样本学习:减少对训练数据的依赖
- 多模态融合:结合深度信息、光谱信息等
- 实时处理:开发高效的硬件加速方案
六、结论
本研究详细介绍了基于生成扩散模型的散射介质成像重建方法(ISDM)。该方法通过VESDE建模前向扩散过程,采用NCSN++网络学习分数函数,结合预测-校正采样策略和数据一致性约束,实现了从散斑图像到原始图像的高质量重建。实验结果表明,与传统方法相比,ISDM在保持结构细节、抑制噪声和处理复杂场景方面具有显著优势。该方法为散射介质成像提供了一种有效的深度学习解决方案,在生物医学成像、遥感探测等领域具有广阔的应用前景。
参考文献
- Song, Y., et al. "Score-Based Generative Modeling through Stochastic Differential Equations." ICLR 2021.
- Ho, J., et al. "Denoising Diffusion Probabilistic Models." NeurIPS 2020.
- Song, Y., & Ermon, S. "Generative Modeling by Estimating Gradients of the Data Distribution." NeurIPS 2019.
- Chen, Z., et al. "Imaging through scattering media via generative diffusion model." Applied Physics Letters, 2024.
报告生成日期:2026年3月20日
程序开发
博主(博士研究生)🛰️: easy_optics,在光学检测领域可提供实验指导、程序开发、申博指导、论文指导。
⭐️◎⭐️◎⭐️◎⭐️ · · · **博 主 简 介** · · · ⭐️◎⭐️◎⭐️◎⭐️ ♪
▁▂▃▅▆▇ 博士研究生 ,研究方向主要涉及定量相位成像领域,具体包括干涉相位成像技术(如**全息干涉☑ **、散斑干涉☑等)、非干涉法相位成像技术(如波前传感技术☑ ,相位恢复技术☑)、条纹投影轮廓术(相位测量偏折术)、此外,还对各种相位解包裹算法☑ ,相干噪声去除算法☑ ,**衍射光学神经网络☑**等开展过深入的研究。
程序获取、程序开发、实验指导,软硬系统开发,科研服务,申博指导,🛰️easy_optics或如下。