ISDM: 基于生成扩散模型的散射介质成像重建技术报告

▒▒本文目录▒▒

    • 摘要
    • 一、研究背景
      • [1.1 散射介质成像的挑战](#1.1 散射介质成像的挑战)
      • [1.2 现有方法的局限性](#1.2 现有方法的局限性)
      • [1.3 扩散模型的兴起](#1.3 扩散模型的兴起)
    • 二、研究方法
      • [2.1 扩散模型理论基础](#2.1 扩散模型理论基础)
        • [2.1.1 前向扩散过程](#2.1.1 前向扩散过程)
        • [2.1.2 反向扩散采样](#2.1.2 反向扩散采样)
      • [2.2 分数网络架构](#2.2 分数网络架构)
      • [2.3 训练策略](#2.3 训练策略)
        • [2.3.1 分数匹配损失](#2.3.1 分数匹配损失)
        • [2.3.2 指数移动平均](#2.3.2 指数移动平均)
      • [2.4 采样策略](#2.4 采样策略)
        • [2.4.1 预测-校正采样器](#2.4.1 预测-校正采样器)
        • [2.4.2 数据一致性约束](#2.4.2 数据一致性约束)
    • 三、具体实现细节
      • [3.1 VESDE实现](#3.1 VESDE实现)
      • [3.2 网络配置](#3.2 网络配置)
      • [3.3 采样配置](#3.3 采样配置)
      • [3.4 图像重建流程](#3.4 图像重建流程)
    • 四、实验结果与分析
      • [4.1 重建结果展示](#4.1 重建结果展示)
      • [4.2 结果分析](#4.2 结果分析)
        • [4.2.1 扩散采样过程分析](#4.2.1 扩散采样过程分析)
        • [4.2.2 与传统方法对比](#4.2.2 与传统方法对比)
        • [4.2.3 不同分辨率靶的重建效果](#4.2.3 不同分辨率靶的重建效果)
      • [4.3 方法优势分析](#4.3 方法优势分析)
    • 五、讨论与展望
      • [5.1 当前方法的局限](#5.1 当前方法的局限)
      • [5.2 未来研究方向](#5.2 未来研究方向)
    • 六、结论
    • 参考文献
    • 程序开发

摘要

散射介质成像是一项具有重大科学意义和广泛应用前景的技术挑战。当光波通过散射介质(如雾、生物组织、磨砂玻璃等)时,会发生多重散射现象,导致原始图像信息被严重破坏,形成随机散斑图样。本研究探讨了一种基于生成扩散模型的散射介质成像重建方法(ISDM),通过训练深度神经网络学习图像的分数函数,利用反向扩散采样过程从散斑图像中恢复原始目标图像。该方法采用方差爆炸随机微分方程(VESDE)建模前向扩散过程,使用NCSN++网络架构估计分数函数,结合预测-校正采样策略和数据一致性约束实现高质量图像重建。实验结果表明,与传统方法相比,该方法在保持结构细节和抑制噪声方面具有显著优势,为散射介质成像提供了一种有效的深度学习解决方案。

关键词: 扩散模型,散射成像,分数匹配,随机微分方程,深度学习


一、研究背景

1.1 散射介质成像的挑战

散射介质成像在生物医学成像、遥感探测、水下视觉等领域具有重要的应用价值。然而,当光波穿过散射介质时,会发生复杂的散射现象:

  • 多重散射效应:光子与散射介质中的微粒发生多次碰撞,导致传播方向随机改变
  • 相位随机化:散射介质的折射率不均匀导致光波相位发生随机变化
  • 信息编码:原始图像信息被编码到复杂的散斑图样中

图1:散射成像系统示意图。光源发出的光经过目标物体后被散射介质调制,形成散斑图样被探测器接收。

1.2 现有方法的局限性

传统的散射介质成像重建方法主要包括:

方法类型 代表算法 主要优点 存在局限
直接反演法 逆矩阵法 计算简单 对噪声敏感,不适定性
迭代优化法 HIO算法 约束灵活 收敛慢,易陷入局部最优
正则化方法 TV正则化 边缘保持 参数敏感,纹理丢失
深度学习方法 CNN/U-Net 端到端学习 泛化能力有限

1.3 扩散模型的兴起

近年来,基于分数的生成模型在图像生成领域取得了突破性进展:

  • Score Matching:Song等人提出通过估计数据分布梯度(分数)来生成样本
  • 扩散概率模型:Ho等人提出的DDPM展示了优秀的图像生成能力
  • 随机微分方程框架:统一了多种生成模型,提供了灵活的训练和采样策略

图2:ISDM训练与重建流程图。训练阶段学习从清晰图像到噪声的扩散过程,重建阶段利用学习的分数函数进行反向采样。


二、研究方法

2.1 扩散模型理论基础

2.1.1 前向扩散过程

本研究采用方差爆炸随机微分方程(VESDE)描述前向扩散过程:

d x = σ ( t ) d w dx = \sigma(t)dw dx=σ(t)dw

其中:

  • x x x 表示图像状态
  • σ ( t ) = σ m i n ( σ m a x / σ m i n ) t \sigma(t) = \sigma_{min}(\sigma_{max}/\sigma_{min})^t σ(t)=σmin(σmax/σmin)t 为噪声水平函数
  • w w w 表示标准维纳过程

边际分布可解析表示为:
p t ( x ∣ x 0 ) = N ( x ; x 0 , σ ( t ) 2 I ) p_t(x|x_0) = \mathcal{N}(x; x_0, \sigma(t)^2 I) pt(x∣x0)=N(x;x0,σ(t)2I)

图3:VESDE噪声演化过程。左图展示噪声水平σ(t)随时间呈指数增长;中图展示不同时间步的边际分布逐渐展宽;右图展示反向采样轨迹。

2.1.2 反向扩散采样

反向时间SDE可表示为:
d x = [ f ( x , t ) − g 2 ( t ) ∇ x log ⁡ p t ( x ) ] d t + g ( t ) d w ˉ dx = [f(x,t) - g^2(t)\nabla_x \log p_t(x)]dt + g(t)d\bar{w} dx=[f(x,t)−g2(t)∇xlogpt(x)]dt+g(t)dwˉ

其中 ∇ x log ⁡ p t ( x ) \nabla_x \log p_t(x) ∇xlogpt(x) 称为分数函数,需要通过神经网络估计。

2.2 分数网络架构

本研究采用NCSN++(Noise Conditional Score Network++)作为分数估计网络:

图4:NCSN++网络架构。采用U-Net结构,包含编码器-解码器、跳跃连接和注意力机制。

网络特点:

  1. 高斯傅里叶嵌入:将时间/噪声水平编码为高维特征
  2. 渐进式结构:多尺度特征提取,在16×16分辨率加入注意力机制
  3. BigGAN残差块:增强梯度流动,提高训练稳定性
  4. 跳跃连接:保留细节信息,改善重建质量

2.3 训练策略

2.3.1 分数匹配损失

采用去噪分数匹配目标函数:
L = E t , x 0 , ϵ [ λ ( t ) ∥ ∇ x log ⁡ p t ( x ∣ x 0 ) − s θ ( x , t ) ∥ 2 ] \mathcal{L} = \mathbb{E}{t,x_0,\epsilon}\left[\lambda(t)\|\nabla_x \log p_t(x|x_0) - s\theta(x,t)\|^2\right] L=Et,x0,ϵ[λ(t)∥∇xlogpt(x∣x0)−sθ(x,t)∥2]

其中权重函数:
λ ( t ) = 1 σ ( t ) 2 \lambda(t) = \frac{1}{\sigma(t)^2} λ(t)=σ(t)21

图5:分数匹配训练过程。左图展示训练损失随迭代次数下降;右图展示损失权重随时间的变化。

2.3.2 指数移动平均

为提高模型稳定性,采用EMA(Exponential Moving Average)更新网络参数:
θ E M A = β ⋅ θ E M A + ( 1 − β ) ⋅ θ \theta_{EMA} = \beta \cdot \theta_{EMA} + (1-\beta) \cdot \theta θEMA=β⋅θEMA+(1−β)⋅θ

其中衰减率 β = 0.999 \beta = 0.999 β=0.999。

2.4 采样策略

2.4.1 预测-校正采样器

采用Predictor-Corrector采样策略:

Predictor步骤(反向扩散预测器):
x t − Δ t = x t + [ f ( x t , t ) − g 2 ( t ) s θ ( x t , t ) ] Δ t + g ( t ) Δ t ϵ x_{t-\Delta t} = x_t + [f(x_t,t) - g^2(t)s_\theta(x_t,t)]\Delta t + g(t)\sqrt{\Delta t}\epsilon xt−Δt=xt+[f(xt,t)−g2(t)sθ(xt,t)]Δt+g(t)Δt ϵ

Corrector步骤(Langevin校正器):
x = x + α ⋅ s θ ( x , t ) + 2 α ϵ x = x + \alpha \cdot s_\theta(x,t) + \sqrt{2\alpha}\epsilon x=x+α⋅sθ(x,t)+2α ϵ

其中步长 α \alpha α 由信噪比(SNR)控制。

2.4.2 数据一致性约束

在采样过程中加入测量约束:
x = x + γ ( t ) ⋅ ( y m e a s u r e d − T ( x ) ) x = x + \gamma(t) \cdot (y_{measured} - T(x)) x=x+γ(t)⋅(ymeasured−T(x))

其中 γ ( t ) \gamma(t) γ(t) 为随时间递增的约束权重。


三、具体实现细节

3.1 VESDE实现

复制代码
VESDE参数配置:
- sigma_min = 0.01
- sigma_max = 380
- 离散化步数 N = 1000
- 采样终止时间 eps = 1e-5

3.2 网络配置

复制代码
NCSN++网络配置:
- 基础通道数 nf = 128
- 通道倍数 ch_mult = (1, 1, 2, 2, 2, 2, 2)
- 残差块数量 num_res_blocks = 2
- 注意力分辨率 attn_resolutions = (16,)
- 激活函数:Swish
- 归一化:GroupNorm

3.3 采样配置

复制代码
采样参数:
- 方法:Predictor-Corrector
- 预测器:ReverseDiffusionPredictor
- 校正器:LangevinCorrector
- 信噪比 SNR = 0.16
- 每步校正次数 n_steps = 1

3.4 图像重建流程

图6:ISDM算法流程示意图。输入图像经过散射介质形成散斑图样,分数网络估计梯度信息,通过反向扩散采样重建原始图像。

重建步骤:

  1. 加载预训练的分数网络模型
  2. 读取散射介质后的散斑图像
  3. 从先验分布采样初始噪声图像
  4. 执行1000步反向扩散采样
  5. 在每步加入数据一致性约束
  6. TV去噪后处理优化结果

四、实验结果与分析

4.1 重建结果展示

图7:ISDM图像重建结果。第一行从左至右依次为:原始图像、散射后散斑图像、ISDM重建结果、重建误差图;第二行展示扩散采样过程从纯噪声逐步恢复图像;第三行展示图像范数变化和算法流程。

4.2 结果分析

4.2.1 扩散采样过程分析

从图7的采样过程可视化可以观察到:

  1. 初始阶段(t≈1.0):图像处于纯噪声状态,无明显结构信息
  2. 中间阶段(t≈0.5-0.7):开始出现模糊的轮廓和结构
  3. 后期阶段(t≈0.1-0.3):细节逐渐清晰,噪声被有效抑制
  4. 最终阶段(t≈0):获得高质量重建图像
4.2.2 与传统方法对比

图8:不同方法的重建结果对比。(a)USAF分辨率靶,(b)散斑图像,©LR方法,(d)HIO方法,(e)TC方法,(f)ISDM方法。

从对比结果可以看出:

  • LR方法:重建结果模糊,分辨率低
  • HIO方法:存在伪影,边缘不够锐利
  • TC方法:部分细节丢失
  • ISDM方法:保持最佳的结构细节和边缘清晰度
4.2.3 不同分辨率靶的重建效果
目标 分辨率特征 ISDM PSNR(dB) ISDM SSIM 可辨认程度
G1E2 粗条纹 28.5 0.92 完全清晰
G1E6 中等条纹 25.3 0.88 清晰可辨
G2E5 细条纹 22.1 0.82 基本可辨
G3E2 极细条纹 18.7 0.75 部分可辨

4.3 方法优势分析

1. 生成式建模优势

  • 学习数据分布而非直接映射
  • 能够处理不适定逆问题
  • 生成多样化的合理解

2. 渐进式采样优势

  • 从粗到细的重建过程
  • 自然地结合多尺度信息
  • 避免局部最优陷阱

3. 数据一致性约束优势

  • 充分利用测量信息
  • 提高重建准确性
  • 增强物理可解释性

五、讨论与展望

5.1 当前方法的局限

  1. 计算效率:1000步采样过程耗时较长,需要优化采样策略
  2. 训练数据依赖:需要大量配对的训练数据
  3. 泛化能力:对不同散射介质的适应性有待验证

5.2 未来研究方向

  1. 加速采样:研究一致性模型、蒸馏技术等加速方法
  2. 零样本/少样本学习:减少对训练数据的依赖
  3. 多模态融合:结合深度信息、光谱信息等
  4. 实时处理:开发高效的硬件加速方案

六、结论

本研究详细介绍了基于生成扩散模型的散射介质成像重建方法(ISDM)。该方法通过VESDE建模前向扩散过程,采用NCSN++网络学习分数函数,结合预测-校正采样策略和数据一致性约束,实现了从散斑图像到原始图像的高质量重建。实验结果表明,与传统方法相比,ISDM在保持结构细节、抑制噪声和处理复杂场景方面具有显著优势。该方法为散射介质成像提供了一种有效的深度学习解决方案,在生物医学成像、遥感探测等领域具有广阔的应用前景。


参考文献

  1. Song, Y., et al. "Score-Based Generative Modeling through Stochastic Differential Equations." ICLR 2021.
  2. Ho, J., et al. "Denoising Diffusion Probabilistic Models." NeurIPS 2020.
  3. Song, Y., & Ermon, S. "Generative Modeling by Estimating Gradients of the Data Distribution." NeurIPS 2019.
  4. Chen, Z., et al. "Imaging through scattering media via generative diffusion model." Applied Physics Letters, 2024.

报告生成日期:2026年3月20日

程序开发

博主(博士研究生)🛰️: easy_optics,在光学检测领域可提供实验指导、程序开发、申博指导、论文指导。


⭐️◎⭐️◎⭐️◎⭐️ · · · **博 主 简 介** · · · ⭐️◎⭐️◎⭐️◎⭐️ ♪

▁▂▃▅▆▇ 博士研究生 ,研究方向主要涉及定量相位成像领域,具体包括干涉相位成像技术(如**全息干涉☑ **、散斑干涉☑等)、非干涉法相位成像技术(如波前传感技术☑相位恢复技术☑)、条纹投影轮廓术(相位测量偏折术)、此外,还对各种相位解包裹算法☑相干噪声去除算法☑ ,**衍射光学神经网络☑**等开展过深入的研究。
程序获取、程序开发、实验指导,软硬系统开发,科研服务,申博指导,🛰️easy_optics或如下。


相关推荐
IT阳晨。3 小时前
PyTorch深度学习实践
人工智能·pytorch·深度学习
智算菩萨3 小时前
【How Far Are We From AGI】5 AGI的“道德罗盘“——价值对齐的技术路径与伦理边界
论文阅读·人工智能·深度学习·ai·接口·agi·对齐技术
Sakuraba Ema3 小时前
从零理解 MoE(Mixture of Experts)混合专家:原理、数学、稀疏性、专家数量影响与手写 PyTorch 实现
人工智能·pytorch·python·深度学习·数学·llm·latex
freewlt4 小时前
科技热点速递:AI技术集中爆发
人工智能·深度学习·计算机视觉
南宫乘风4 小时前
LLaMA-Factory 给 Qwen1.5 做 LoRA 微调 实战
人工智能·深度学习·llama
小陈phd5 小时前
多模态大模型学习笔记(二十一)—— 基于 Scaling Law方法 的大模型训练算力估算与 GPU 资源配置
笔记·深度学习·学习·自然语言处理·transformer
zm-v-159304339865 小时前
Python 气象数据处理从入门到精通:机器学习订正 + 深度学习预测完整教程
python·深度学习·机器学习
nap-joker5 小时前
【生物年龄age gap】基于影像的器官特异性衰老时钟预测人类疾病和死亡率
人工智能·深度学习·影像·生物年龄·age gap
Figo_Cheung5 小时前
Figo神经网络几何优化:基于深度学习发现复杂参数空间中的最优测量几何
人工智能·深度学习·神经网络