目录
[1 文献阅读 《Quantum Machine Learning for Climate Modelling》](#1 文献阅读 《Quantum Machine Learning for Climate Modelling》)
[1.1 研究背景](#1.1 研究背景)
[1.2 方法论](#1.2 方法论)
[1.3 创新点](#1.3 创新点)
[1.4 实验结果](#1.4 实验结果)
[3 总结](#3 总结)
摘要
本周主要阅读了《Quantum Machine Learning for Climate Modelling》这篇论文,了解了使用量子神经网络进行云量参数化的方法,主要包括量子部分的网络实现以及 shap 分析的评估方法。
Abstract
This week, I mainly read the paper titled "Quantum Machine Learning for Climate Modelling" and learned about the method of using quantum neural networks for cloud fraction parameterization, which primarily includes the network implementation of the quantum part and the evaluation method using SHAP analysis.
1 文献阅读 《Quantum Machine Learning for Climate Modelling》
1.1 研究背景
地球系统模型(ESM)是地球系统不同组成部分及其相互作用的全球耦合模型,包括大气、海洋、陆地和冰冻圈,通常用于预测未来气候变化,以改进气候变化减缓和适应策略。一般来说,用于的 ESM 存在计算成本高和分辨率受限的问题,而且云物理和湍流等亚网格过程无法直接解析,需要经验参数化,这会带来偏差。
同时,结合机器学习(ML)改善传统物理模型已被证实可行,但经典 ML 模型在超出训练区域时泛化能力有限。量子机器学习(QML)则因其潜在的高表达能力和良好的泛化性能为改进 ESM 中的参数化提供了新思路。
1.2 方法论
本文旨在使用量子神经网络进行云量参数化以替代传统参数化方案,同时探索 QNN 与经典神经网络(NN)的性能和学习稳定性差异。故方法论主要包括数据处理,架构设计,训练方法与评估方法几个方面。
其中,数据主要使用高分辨率 ICON 模型模拟(水平分辨率 2.5 km),再进行粗粒化到 80km 网格作为训练数据,输入特征包含比湿、云水、云冰、温度、压力、水平风速、几何高度、纬度等。
架构上,QNN 包括数据重上传、变分量子电路和测量后的线性加权输出,量子比特数量与输入特征数相等,经过适当的重新缩放后,输入特征被编码为多层编码层中单量子比特旋转的角度,整体通过 Pennylane 库在 Python 中进行数值模拟,并用 JAX 进行优化;

p.s. 数据重上传用于增加模型能够捕获的傅里叶频率数量。
经典 NN 则采用三层隐藏层,节点数分别为 12、6、2,输出云量。
最后,通过 SHAP 值,即根据输入特征在模型输出中添加或移除的部分进行评分,以评估输入特征对模型预测的贡献,从而比较 QNN 和经典 NN 的特征重要性与稳定性。
1.3 创新点
本文创新点主要如下:
首先,将量子神经网络直接嵌入 ESM 参数化流程,是 QML 在气候建模的实际应用探索。
其次,利用数据重上传与变分量子电路设计增加模型的 Fourier 表达能力和非线性处理能力,使 QNN 可捕捉复杂的输入输出关系。
最后,首次将 SHAP 方法系统应用于量子机器学习模型,比较量子与经典网络在学习物理规律上的稳定性。
1.4 实验结果
本文实验主要分为性能比较与可解释性分析两部分。
在性能比较上,QNN 与经典 NN 在均方误差和 指标上相近,均明显优于传统 Xu-Randall 参数化,当两者具有相似数量的自由参数时,经典NN在性能上略优于QNN。另外,QNN 对训练噪声表现出较好鲁棒性,当采样次数足够大时,含噪声的训练能够成功并紧密贴合无噪声的训练曲线;不过当采样次数较少时,训练初期均方误差会下降,但随后会变得不稳定。
在可解释性分析上,QNN 的特征重要性分布(SHAP 值)在不同训练实例间较为稳定,而经典 NN 则差异巨大,这主要是因为它可能学到不一致甚至非物理的关系。
3 总结
本周三次元的事情较多,所以只简单看了下论文,整体感觉中规中矩。其模型跟上篇论文差不太多,貌似还包括一部分在量子计算机上进行的部分。相对重点感觉是了解到了 shap 分析这种无关模型的评估方法,感觉后面可能会有使用的地方。下周大概会延续之前的想法,一是找一篇方便复现的或者方法上有不同(比如量子结合不同的模型架构之类)的论文进行阅读,二是寻找一下公开可用的数据集。