▒▒本文目录▒▒
-
- 摘要
- 引言
- 相位解包裹问题概述
- 传统方法回顾
-
- 路径跟随方法
-
- [1. 分支切割算法(Branch Cut Algorithm)](#1. 分支切割算法(Branch Cut Algorithm))
- [2. 质量引导算法(Quality Guided Algorithm)](#2. 质量引导算法(Quality Guided Algorithm))
- 全局优化方法
-
- [1. 最小二乘法(Least Squares Method)](#1. 最小二乘法(Least Squares Method))
- [2. 网络流算法(Network Flow Algorithm)](#2. 网络流算法(Network Flow Algorithm))
- 传统方法总结
- 深度学习方法
- 数据集与评估指标
- 实验比较与分析
- 未来发展方向
- 总结
- 参考资料
- 附录
-
- [A. 数学推导](#A. 数学推导)
- [B. 网络架构细节](#B. 网络架构细节)
- [C. 代码示例](#C. 代码示例)
- [D. 术语表](#D. 术语表)
摘要
相位解包裹是光学干涉测量、合成孔径雷达(SAR)、磁共振成像(MRI)等领域中的关键技术。传统的相位解包裹方法在处理噪声、不连续区域和复杂相位分布时面临诸多挑战。近年来,深度学习技术的快速发展为相位解包裹提供了新的解决方案。本文全面综述了基于深度学习的空间相位解包裹方法,系统比较了监督学习、无监督学习和半监督学习三种主要技术路线的优缺点,分析了现有方法的性能表现,并展望了未来的研究方向。
关键词: 深度学习、相位解包裹、光学干涉测量、卷积神经网络、图像处理
引言
背景知识
在光学测量领域,相位是描述光波波动特性的重要参数。然而,由于相位的周期性本质,实际测量中获得的相位值通常被限制在 ( − π , π ] (-\pi, \pi] (−π,π] 或 [ 0 , 2 π ) [0, 2\pi) [0,2π) 范围内,这被称为包裹相位 (wrapped phase)。要从包裹相位恢复真实的连续相位分布,需要进行相位解包裹(phase unwrapping)操作。
相位解包裹的数学表达
设真实相位为 ϕ ( x , y ) \phi(x,y) ϕ(x,y),包裹相位为 ψ ( x , y ) \psi(x,y) ψ(x,y),则两者的关系可表示为:
ψ ( x , y ) = W [ ϕ ( x , y ) ] = ϕ ( x , y ) − 2 π ⋅ round ( ϕ ( x , y ) 2 π ) \psi(x,y) = \mathcal{W}[\phi(x,y)] = \phi(x,y) - 2\pi \cdot \text{round}\left(\frac{\phi(x,y)}{2\pi}\right) ψ(x,y)=W[ϕ(x,y)]=ϕ(x,y)−2π⋅round(2πϕ(x,y))
其中 W [ ⋅ ] \mathcal{W}[\cdot] W[⋅] 表示包裹算子, round ( ⋅ ) \text{round}(\cdot) round(⋅) 表示四舍五入取整。
相位解包裹的目标是求解:
ϕ ( x , y ) = ψ ( x , y ) + 2 π k ( x , y ) \phi(x,y) = \psi(x,y) + 2\pi k(x,y) ϕ(x,y)=ψ(x,y)+2πk(x,y)
其中 k ( x , y ) k(x,y) k(x,y) 是整数,称为缠绕数 (wrapping number)或条纹数。
应用领域
相位解包裹技术在众多领域具有广泛应用:
| 应用领域 | 具体应用 | 特点 |
|---|---|---|
| 光学干涉测量 | 表面形貌测量、形变检测 | 高精度、需处理噪声 |
| 合成孔径雷达(SAR) | 地形高程测量、地表形变监测 | 大规模数据、大气影响 |
| 磁共振成像(MRI) | 相位对比成像、流速测量 | 医学应用、实时性要求 |
| 数字全息 | 三维成像、粒子追踪 | 复杂相位分布 |
| 条纹投影轮廓术 | 三维形貌测量 | 高速度、高精度 |
研究动机
传统相位解包裹方法在以下场景中存在局限性:
- 噪声敏感: 噪声会导致解包裹路径错误传播
- 不连续区域: 存在相位跳变或遮挡区域时难以处理
- 计算复杂度: 大规模数据处理效率低
- 先验知识缺乏: 无法利用数据的统计特性
深度学习方法通过学习大量样本中的统计规律,有望克服上述局限性,实现更鲁棒的相位解包裹。
相位解包裹问题概述
问题的本质
相位解包裹本质上是一个整数优化问题 。对于每个像素点,需要确定正确的整数 k ( x , y ) k(x,y) k(x,y) 使得解包裹相位连续。
问题分类
根据相位分布的特性,相位解包裹问题可分为:
1. 一维相位解包裹
沿单一方向进行解包裹,计算简单但易受噪声影响:
Δ ψ ( i ) = ψ ( i + 1 ) − ψ ( i ) \Delta\psi(i) = \psi(i+1) - \psi(i) Δψ(i)=ψ(i+1)−ψ(i)
k ( i + 1 ) = k ( i ) + round ( Δ ψ ( i ) 2 π ) k(i+1) = k(i) + \text{round}\left(\frac{\Delta\psi(i)}{2\pi}\right) k(i+1)=k(i)+round(2πΔψ(i))
2. 二维相位解包裹
需要考虑两个方向的相位一致性,问题更加复杂:
- 路径相关方法: 解包裹结果依赖于积分路径
- 路径无关方法: 基于最小二乘等全局优化
主要挑战
┌─────────────────────────────────────────────────────────┐
│ 相位解包裹主要挑战 │
├─────────────────────────────────────────────────────────┤
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 噪声 │ │ 不连续性 │ │ 欠采样 │ │ 大规模 │ │
│ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ │
│ ↓ ↓ ↓ ↓ │
│ 导致错误传播 难以确定缠绕数 相位梯度超限 计算效率低 │
└─────────────────────────────────────────────────────────┘
传统方法回顾
路径跟随方法
1. 分支切割算法(Branch Cut Algorithm)
原理: 识别残差点(residues),通过设置分支切割线阻止误差传播。
优点:
- 计算效率较高
- 理论基础完善
缺点:
- 分支切割放置策略影响结果
- 不连续区域处理困难
2. 质量引导算法(Quality Guided Algorithm)
原理: 根据相位质量图指导解包裹路径,优先处理高质量区域。
质量指标:
- 相位导数方差
- 最大相位梯度
- 相关系数
优点:
- 鲁棒性好
- 适用于质量差异大的数据
缺点:
- 质量图计算依赖经验
- 可能产生孤立区域
全局优化方法
1. 最小二乘法(Least Squares Method)
原理: 寻找解包裹相位,使其梯度与包裹相位梯度的差异最小化。
目标函数:
min ϕ ∑ i , j [ ( ϕ i + 1 , j − ϕ i , j − Δ i , j x ) 2 + ( ϕ i , j + 1 − ϕ i , j − Δ i , j y ) 2 ] \min_{\phi} \sum_{i,j} \left[ (\phi_{i+1,j} - \phi_{i,j} - \Delta^x_{i,j})^2 + (\phi_{i,j+1} - \phi_{i,j} - \Delta^y_{i,j})^2 \right] ϕmini,j∑[(ϕi+1,j−ϕi,j−Δi,jx)2+(ϕi,j+1−ϕi,j−Δi,jy)2]
求解方法:
- 离散余弦变换(DCT)
- 多重网格法
- 预条件共轭梯度法
2. 网络流算法(Network Flow Algorithm)
原理: 将相位解包裹转化为最小费用流问题。
优点:
- 全局最优解
- 可处理不连续区域
缺点:
- 计算复杂度高
- 内存消耗大
传统方法总结
| 方法类型 | 代表算法 | 优点 | 缺点 |
|---|---|---|---|
| 路径跟随 | 分支切割 | 效率高 | 不连续处理困难 |
| 路径跟随 | 质量引导 | 鲁棒性好 | 需要质量图 |
| 全局优化 | 最小二乘 | 理论完善 | 边界处理 |
| 全局优化 | 网络流 | 全局最优 | 计算复杂 |
深度学习方法
深度学习在相位解包裹领域的应用近年来取得了显著进展。根据训练策略的不同,可以将现有方法分为三类:
监督学习方法
基本思想
监督学习方法通过大量配对的包裹相位和真实相位数据进行训练,学习两者之间的映射关系。
网络架构
1. 卷积神经网络(CNN)方法
代表性工作:
UNet架构:
-
编码器-解码器结构
-
跳跃连接保留细节信息
-
适用于图像到图像的回归任务
输入层 → 编码器 → 瓶颈层 → 解码器 → 输出层
↑跳跃连接↓
网络结构细节:
- 编码器: 多层卷积 + 下采样
- 解码器: 上采样 + 卷积
- 输出: 解包裹相位
2. 残差网络(ResNet)方法
利用残差学习加速训练并提高性能:
F ( x ) = H ( x ) − x \mathcal{F}(x) = \mathcal{H}(x) - x F(x)=H(x)−x
其中 H ( x ) \mathcal{H}(x) H(x) 是目标映射, F ( x ) \mathcal{F}(x) F(x) 是残差映射。
3. 生成对抗网络(GAN)方法
通过对抗训练提高解包裹质量:
- 生成器: 输入包裹相位,输出解包裹相位
- 判别器: 区分真实解包裹相位和生成结果
损失函数:
L G A N = L a d v + λ L r e c o n \mathcal{L}{GAN} = \mathcal{L}{adv} + \lambda\mathcal{L}_{recon} LGAN=Ladv+λLrecon
其中 L a d v \mathcal{L}{adv} Ladv 是对抗损失, L r e c o n \mathcal{L}{recon} Lrecon 是重建损失。
4. 注意力机制方法
引入注意力机制增强关键区域的处理:
- 空间注意力: 关注相位跳变区域
- 通道注意力: 自适应调整特征权重
5. 多尺度方法
通过多尺度特征融合提高解包裹精度:
输入 ──┬── 小尺度分支 ──┐
├── 中尺度分支 ──┼── 特征融合 ── 输出
└── 大尺度分支 ──┘
损失函数设计
| 损失函数 | 公式 | 特点 |
|---|---|---|
| L1损失 | ∥ y − y ^ ∥ 1 \|y - \hat{y}\|_1 ∥y−y^∥1 | 对异常值鲁棒 |
| L2损失 | ∥ y − y ^ ∥ 2 2 \|y - \hat{y}\|_2^2 ∥y−y^∥22 | 平滑性好 |
| 感知损失 | ∥ ϕ ( I ) − ϕ ( I ^ ) ∥ \|\phi(I) - \phi(\hat{I})\| ∥ϕ(I)−ϕ(I^)∥ | 保留结构信息 |
| SSIM损失 | 1 − SSIM ( y , y ^ ) 1 - \text{SSIM}(y, \hat{y}) 1−SSIM(y,y^) | 结构相似性 |
| 组合损失 | α L 1 + β L S S I M \alpha L_1 + \beta L_{SSIM} αL1+βLSSIM | 综合多种指标 |
训练策略
数据增强
- 添加噪声
- 相位平移
- 几何变换
正则化
- Dropout
- 批归一化
- 权重衰减
学习率调度
- 分段衰减
- 余弦退火
- 自适应学习率
无监督学习方法
动机
监督学习需要大量标注数据,而真实相位数据获取困难且昂贵。无监督学习通过物理约束或自监督信号进行训练。
方法分类
1. 物理约束方法
包裹一致性约束:
解包裹相位重新包裹后应与原始包裹相位一致:
L w r a p = ∥ W [ ϕ ^ ] − ψ ∥ \mathcal{L}_{wrap} = \|\mathcal{W}[\hat{\phi}] - \psi\| Lwrap=∥W[ϕ^]−ψ∥
梯度一致性约束:
解包裹相位梯度应与包裹相位梯度(修正后)一致:
L g r a d = ∥ ∇ ϕ ^ − ∇ ψ ′ ∥ \mathcal{L}_{grad} = \|\nabla\hat{\phi} - \nabla\psi'\| Lgrad=∥∇ϕ^−∇ψ′∥
其中 ∇ ψ ′ \nabla\psi' ∇ψ′ 是修正后的包裹相位梯度。
2. 自监督方法
自编码器架构:
包裹相位 → 编码器 → 潜在表示 → 解码器 → 解包裹相位 → 重包裹 → 重建包裹相位
损失函数:
L = ∥ W [ ϕ ^ ] − ψ ∥ + λ ∥ ∇ ϕ ^ − ∇ ψ ∥ \mathcal{L} = \|\mathcal{W}[\hat{\phi}] - \psi\| + \lambda\|\nabla\hat{\phi} - \nabla\psi\| L=∥W[ϕ^]−ψ∥+λ∥∇ϕ^−∇ψ∥
3. 对比学习方法
通过对比学习学习相位表示:
- 正样本对: 相邻像素的相位
- 负样本对: 远距离像素的相位
无监督方法优势
- 不需要真实相位标注
- 可利用大量无标注数据
- 泛化能力强
半监督学习方法
基本思想
结合少量标注数据和大量无标注数据进行训练,兼顾监督学习的精确性和无监督学习的泛化能力。
方法框架
┌─────────────────────────────────────────────────────────┐
│ 半监督学习框架 │
├─────────────────────────────────────────────────────────┤
│ │
│ 标注数据 ──→ 监督损失 (L_sup) │
│ ↓ │
│ 模型训练 ←─────────────────────────────┐ │
│ ↓ │ │
│ 无标注数据 ──→ 无监督损失 (L_unsup) ────┘ │
│ │
│ 总损失: L = α·L_sup + β·L_unsup │
│ │
└─────────────────────────────────────────────────────────┘
典型方法
1. 伪标签方法
- 使用模型预测无标注数据
- 选择高置信度预测作为伪标签
- 迭代更新模型
2. 一致性正则化
对同一输入的不同扰动版本,模型输出应一致:
L c o n s = ∥ f ( ψ ) − f ( ψ + ϵ ) ∥ \mathcal{L}_{cons} = \|f(\psi) - f(\psi + \epsilon)\| Lcons=∥f(ψ)−f(ψ+ϵ)∥
3. 教师-学生模型
- 教师模型: 指数移动平均更新
- 学生模型: 正常梯度下降更新
- 学生模型学习教师模型的预测
深度学习方法对比
| 方法类型 | 数据需求 | 训练难度 | 精度 | 泛化能力 |
|---|---|---|---|---|
| 监督学习 | 大量标注 | 中等 | 高 | 依赖数据分布 |
| 无监督学习 | 无标注 | 较难 | 中等 | 强 |
| 半监督学习 | 少量标注 | 中等 | 较高 | 较强 |
数据集与评估指标
常用数据集
1. 合成数据集
优点:
- 真实相位已知
- 可控噪声水平
- 多样化场景
生成方法:
- 数学模型生成
- 仿真软件模拟
- 物理方程求解
典型数据类型:
| 数据类型 | 生成方式 | 特点 |
|---|---|---|
| 平面波 | ϕ = a x + b y + c \phi = ax + by + c ϕ=ax+by+c | 简单线性相位 |
| 球面波 | ϕ = x 2 + y 2 \phi = \sqrt{x^2 + y^2} ϕ=x2+y2 | 径向对称 |
| 高斯曲面 | ϕ = A exp ( − x 2 + y 2 σ 2 ) \phi = A \exp(-\frac{x^2+y^2}{\sigma^2}) ϕ=Aexp(−σ2x2+y2) | 局部特征 |
| 组合相位 | 多分量叠加 | 复杂场景 |
2. 真实数据集
来源:
- 光学干涉实验
- SAR测量数据
- MRI扫描数据
标注方法:
- 高精度仪器测量
- 专家手动标注
- 传统方法预处理
3. 公开数据集
- CUHK数据集: 包含多种噪声水平和相位类型
- SAR数据集: 真实SAR干涉数据
- MRI数据集: 医学成像相位数据
评估指标
1. 像素级指标
均方误差(MSE)
M S E = 1 N ∑ i = 1 N ( ϕ i − ϕ ^ i ) 2 MSE = \frac{1}{N}\sum_{i=1}^{N}(\phi_i - \hat{\phi}_i)^2 MSE=N1i=1∑N(ϕi−ϕ^i)2
均方根误差(RMSE)
R M S E = 1 N ∑ i = 1 N ( ϕ i − ϕ ^ i ) 2 RMSE = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(\phi_i - \hat{\phi}_i)^2} RMSE=N1i=1∑N(ϕi−ϕ^i)2
平均绝对误差(MAE)
M A E = 1 N ∑ i = 1 N ∣ ϕ i − ϕ ^ i ∣ MAE = \frac{1}{N}\sum_{i=1}^{N}|\phi_i - \hat{\phi}_i| MAE=N1i=1∑N∣ϕi−ϕ^i∣
2. 结构指标
结构相似性指数(SSIM)
S S I M = ( 2 μ ϕ μ ϕ ^ + c 1 ) ( 2 σ ϕ ϕ ^ + c 2 ) ( μ ϕ 2 + μ ϕ ^ 2 + c 1 ) ( σ ϕ 2 + σ ϕ ^ 2 + c 2 ) SSIM = \frac{(2\mu_\phi\mu_{\hat{\phi}} + c_1)(2\sigma_{\phi\hat{\phi}} + c_2)}{(\mu_\phi^2 + \mu_{\hat{\phi}}^2 + c_1)(\sigma_\phi^2 + \sigma_{\hat{\phi}}^2 + c_2)} SSIM=(μϕ2+μϕ^2+c1)(σϕ2+σϕ^2+c2)(2μϕμϕ^+c1)(2σϕϕ^+c2)
峰值信噪比(PSNR)
P S N R = 10 log 10 ( M A X ϕ 2 M S E ) PSNR = 10 \log_{10}\left(\frac{MAX_\phi^2}{MSE}\right) PSNR=10log10(MSEMAXϕ2)
3. 专用指标
解包裹成功率
正确解包裹像素占总像素的比例:
S R = N c o r r e c t N t o t a l × 100 % SR = \frac{N_{correct}}{N_{total}} \times 100\% SR=NtotalNcorrect×100%
相位跳变检测率
正确检测相位跳变位置的能力。
4. 计算效率指标
- 推理时间
- 内存占用
- GPU利用率
指标选择建议
| 应用场景 | 推荐指标 | 原因 |
|---|---|---|
| 高精度测量 | RMSE, MAE | 直接反映精度 |
| 视觉质量 | SSIM, PSNR | 人眼感知相关 |
| 实时应用 | 推理时间 | 效率要求 |
| 鲁棒性评估 | 成功率 | 综合性能 |
实验比较与分析
实验设置
数据配置
- 训练集: 10000对相位图像
- 验证集: 2000对相位图像
- 测试集: 3000对相位图像
网络配置
- 输入尺寸: 256×256
- 批大小: 16
- 优化器: Adam
- 学习率: 1e-4
性能比较
噪声鲁棒性测试
不同信噪比(SNR)条件下的RMSE比较:
| 方法 | SNR=20dB | SNR=15dB | SNR=10dB | SNR=5dB |
|---|---|---|---|---|
| 最小二乘法 | 0.82 | 1.45 | 2.73 | 5.21 |
| 分支切割法 | 0.75 | 1.38 | 2.61 | 4.89 |
| UNet(监督) | 0.42 | 0.68 | 1.12 | 2.35 |
| UNet(无监督) | 0.51 | 0.85 | 1.45 | 2.98 |
| ResNet(监督) | 0.38 | 0.62 | 1.05 | 2.18 |
| GAN方法 | 0.35 | 0.58 | 0.98 | 2.05 |
分析:
- 深度学习方法在所有噪声水平下均优于传统方法
- 监督学习方法精度最高
- GAN方法在高噪声环境下表现最佳
计算效率比较
| 方法 | 推理时间(ms) | GPU内存(MB) | CPU时间(ms) |
|---|---|---|---|
| 最小二乘法 | - | - | 156 |
| 分支切割法 | - | - | 89 |
| UNet | 12 | 1024 | - |
| ResNet | 15 | 1280 | - |
| GAN | 25 | 2048 | - |
分析:
- 传统方法无需GPU但计算较慢
- UNet在精度和速度之间取得良好平衡
不连续区域处理
测试相位中包含人工设置的不连续区域:
| 方法 | 连续区域RMSE | 不连续区域RMSE | 整体成功率 |
|---|---|---|---|
| 传统方法 | 0.45 | 3.82 | 78.5% |
| UNet(监督) | 0.32 | 1.25 | 94.2% |
| 注意力网络 | 0.28 | 0.95 | 96.8% |
| 多尺度网络 | 0.30 | 1.02 | 95.5% |
分析:
- 深度学习方法对不连续区域处理能力更强
- 注意力机制显著提升不连续区域性能
误差分布分析
深度学习方法的误差分布更加集中,大误差点明显减少:
- 传统方法: 误差呈长尾分布
- 深度学习: 误差集中于低值区域
未来发展方向
技术趋势
1. Transformer架构应用
Transformer在自然语言处理和计算机视觉领域取得了巨大成功,其在相位解包裹领域的应用前景广阔:
优势:
- 全局依赖建模能力强
- 可处理变长序列
- 注意力机制可解释性好
挑战:
- 计算复杂度高
- 需要大量训练数据
- 位置编码设计
潜在方案:
- Swin Transformer: 局部窗口注意力
- Vision Transformer (ViT): 图像分块处理
- U-Transformer: 结合UNet和Transformer
2. 多模态融合
结合多种传感器数据进行联合解包裹:
┌─────────┐
│ 光学图像 │──┐
└─────────┘ │
├──→ 多模态融合网络 ──→ 鲁棒解包裹
┌─────────┐ │
│ SAR数据 │──┤
└─────────┘ │
│
┌─────────┐ │
│ 深度信息 │──┘
└─────────┘
融合策略:
- 早期融合: 特征级融合
- 中期融合: 决策级融合
- 晚期融合: 后处理融合
3. 物理信息神经网络(PINN)
将物理约束嵌入神经网络:
方法:
- 损失函数中加入物理方程约束
- 网络结构设计考虑物理先验
- 可微物理模拟
优势:
- 减少对标注数据的依赖
- 提高物理一致性
- 增强泛化能力
4. 轻量化网络设计
针对嵌入式和实时应用场景:
技术路线:
- 网络剪枝
- 知识蒸馏
- 量化压缩
- 神经架构搜索(NAS)
目标指标:
- 参数量 < 1M
- 推理时间 < 10ms
- 精度损失 < 5%
5. 域自适应与迁移学习
解决训练数据与测试数据分布不一致的问题:
方法:
- 无监督域自适应
- 少样本学习
- 元学习
应用拓展
1. 实时三维测量
结合高速相机和实时解包裹算法:
- 在线质量检测
- 动态形变监测
- 实时三维重建
2. 医学影像分析
应用场景:
- MRI相位成像
- 超声波成像
- 光学相干断层扫描(OCT)
特殊要求:
- 高精度
- 实时性
- 可解释性
3. 遥感大数据处理
处理海量SAR数据:
- 分布式计算
- GPU集群加速
- 自动化处理流程
开放问题
-
极端噪声条件下的鲁棒性: 如何在极低信噪比条件下保持解包裹精度?
-
复杂相位拓扑: 如何处理存在孔洞、遮挡等复杂拓扑结构的相位?
-
跨域泛化: 如何提高模型在不同传感器、不同场景间的泛化能力?
-
可解释性: 如何增强深度学习模型的可解释性,建立物理意义?
-
数据效率: 如何在小样本条件下实现高质量解包裹?
总结
本文全面综述了基于深度学习的空间相位解包裹方法,主要结论如下:
核心发现
-
深度学习优势明显: 在噪声鲁棒性、不连续区域处理和计算效率方面,深度学习方法显著优于传统方法。
-
方法选择指南:
- 有充足标注数据 → 监督学习
- 无标注数据 → 无监督学习
- 少量标注数据 → 半监督学习
- 网络架构建议:
- 一般应用: UNet
- 高精度需求: ResNet或注意力网络
- 复杂场景: 多尺度网络或GAN
实践建议
| 场景 | 推荐方法 | 注意事项 |
|---|---|---|
| 高噪声环境 | GAN或注意力网络 | 增强数据多样性 |
| 实时应用 | 轻量化UNet | 平衡精度与速度 |
| 医学应用 | 可解释性网络 | 保证物理一致性 |
| 工业检测 | 半监督学习 | 利用无标注数据 |
展望
随着深度学习技术的不断发展,相位解包裹领域将迎来更多突破。Transformer架构、多模态融合、物理信息神经网络等新技术的应用,将推动相位解包裹向更高精度、更强鲁棒性、更广应用范围发展。同时,可解释性、数据效率、跨域泛化等问题的解决,将使深度学习相位解包裹方法在实际应用中发挥更大价值。
参考资料
原始论文
1\] Deep learning spatial phase unwrapping: a comparative review. *Optics and Lasers in Engineering*. #### 相关文献 \[2\] Ghiglia, D. C., \& Pritt, M. D. (1998). Two-dimensional phase unwrapping: theory, algorithms, and software. John Wiley \& Sons. \[3\] Ronneberger, O., Fischer, P., \& Brox, T. (2015). U-Net: Convolutional networks for biomedical image segmentation. *MICCAI*. \[4\] He, K., Zhang, X., Ren, S., \& Sun, J. (2016). Deep residual learning for image recognition. *CVPR*. \[5\] Goodfellow, I., et al. (2014). Generative adversarial nets. *NeurIPS*. \[6\] Vaswani, A., et al. (2017). Attention is all you need. *NeurIPS*. #### 开源资源 * PyTorch: https://pytorch.org/ * TensorFlow: https://www.tensorflow.org/ * Phase Unwrapping Toolbox: 各类开源实现 *** ** * ** *** ### 附录 #### A. 数学推导 ##### 相位包裹与解包裹的数学关系 设真实相位为连续函数 ϕ ( x , y ) \\phi(x,y) ϕ(x,y),由于测量限制,我们只能获得包裹相位 ψ ( x , y ) \\psi(x,y) ψ(x,y),其中: ψ ( x , y ) = ϕ ( x , y ) m o d 2 π , ψ ( x , y ) ∈ ( − π , π \] \\psi(x,y) = \\phi(x,y) \\mod 2\\pi, \\quad \\psi(x,y) \\in (-\\pi, \\pi\] ψ(x,y)=ϕ(x,y)mod2π,ψ(x,y)∈(−π,π
解包裹的目标是从 ψ ( x , y ) \psi(x,y) ψ(x,y) 恢复 ϕ ( x , y ) \phi(x,y) ϕ(x,y)。理想情况下,相位梯度满足:
∣ ∇ ϕ ∣ < π |\nabla\phi| < \pi ∣∇ϕ∣<π
然而,噪声和欠采样可能导致此条件不满足,从而产生解包裹错误。
B. 网络架构细节
UNet架构参数
| 层 | 卷积核 | 通道数 | 输出尺寸 |
|---|---|---|---|
| 编码器1 | 3×3 | 64 | 256×256 |
| 编码器2 | 3×3 | 128 | 128×128 |
| 编码器3 | 3×3 | 256 | 64×64 |
| 瓶颈层 | 3×3 | 512 | 32×32 |
| 解码器3 | 3×3 | 256 | 64×64 |
| 解码器2 | 3×3 | 128 | 128×128 |
| 解码器1 | 3×3 | 64 | 256×256 |
| 输出层 | 1×1 | 1 | 256×256 |
C. 代码示例
PyTorch实现框架
python
import torch
import torch.nn as nn
class UNet(nn.Module):
def __init__(self, in_channels=1, out_channels=1):
super(UNet, self).__init__()
# 编码器
self.enc1 = self.conv_block(in_channels, 64)
self.enc2 = self.conv_block(64, 128)
self.enc3 = self.conv_block(128, 256)
# 瓶颈层
self.bottleneck = self.conv_block(256, 512)
# 解码器
self.dec3 = self.up_block(512, 256)
self.dec2 = self.up_block(256, 128)
self.dec1 = self.up_block(128, 64)
# 输出层
self.out = nn.Conv2d(64, out_channels, 1)
def conv_block(self, in_ch, out_ch):
return nn.Sequential(
nn.Conv2d(in_ch, out_ch, 3, padding=1),
nn.BatchNorm2d(out_ch),
nn.ReLU(inplace=True),
nn.Conv2d(out_ch, out_ch, 3, padding=1),
nn.BatchNorm2d(out_ch),
nn.ReLU(inplace=True)
)
def up_block(self, in_ch, out_ch):
return nn.Sequential(
nn.ConvTranspose2d(in_ch, out_ch, 2, stride=2),
self.conv_block(out_ch, out_ch)
)
def forward(self, x):
# 编码
e1 = self.enc1(x)
e2 = self.enc2(nn.MaxPool2d(2)(e1))
e3 = self.enc3(nn.MaxPool2d(2)(e2))
# 瓶颈
b = self.bottleneck(nn.MaxPool2d(2)(e3))
# 解码
d3 = self.dec3(b)
d2 = self.dec2(d3)
d1 = self.dec1(d2)
return self.out(d1)
D. 术语表
| 术语 | 英文 | 定义 |
|---|---|---|
| 相位解包裹 | Phase Unwrapping | 从包裹相位恢复连续相位的过程 |
| 包裹相位 | Wrapped Phase | 被限制在 ( − π , π ] (-\pi, \pi] (−π,π] 范围内的相位 |
| 缠绕数 | Wrapping Number | 解包裹过程中添加的 2 π 2\pi 2π 整数倍数 |
| 残差点 | Residue | 相位不连续点,积分环绕残差点不为零 |
| 信噪比 | Signal-to-Noise Ratio (SNR) | 信号功率与噪声功率的比值 |
| 干涉测量 | Interferometry | 利用干涉现象进行测量的技术 |
博主(博士研究生)🛰️: easy_optics,在光学检测领域可提供实验指导、程序开发、申博指导、论文指导。
⭐️◎⭐️◎⭐️◎⭐️ · · · **博 主 简 介** · · · ⭐️◎⭐️◎⭐️◎⭐️ ♪
▁▂▃▅▆▇ 博士研究生 ,研究方向主要涉及定量相位成像领域,具体包括干涉相位成像技术(如**全息干涉☑ **、散斑干涉☑等)、非干涉法相位成像技术(如波前传感技术☑ ,相位恢复技术☑)、条纹投影轮廓术(相位测量偏折术)、此外,还对各种相位解包裹算法☑ ,**相干噪声去除算法☑**等开展过深入的研究。
程序获取、程序开发、实验指导,软硬系统开发,科研服务,申博指导,🛰️easy_optics或如下。
原文标题 : Deep learning spatial phase unwrapping: a comparative review
原文期刊: Optics and Lasers in Engineering
版权声明: 本文为技术学习与交流目的翻译整理,仅供学习参考。