深度学习周报（4.27~5.3）

摘要

本周主要阅读了《A quantum neural network model for short term wind speed forecasting using weather data》这篇论文，主要了解了纯量子模型的设计、实现以及评估方法，同时学习了量子电路仿真与量子模型的划分。

Abstarct

This week, I mainly read the paper "A quantum neural network model for short term wind speed forecasting using weather data," gaining an understanding of the design, implementation, and evaluation methods of pure quantum models, while also studying quantum circuit simulation and quantum model partitioning.

1 文献阅读

链接：A quantum neural network model for short term wind speed forecasting using weather data - ScienceDirect

1.1 背景

温室气体持续排放引发了全球性环境危机，这让开发利用可持续能源变得愈发紧迫。风能作为一种可再生能源潜力巨大，例如，准确的风速预测对于优化风电并网、提高风电场效率至关重要。

然而，风速变化本身具有高度的非线性和复杂性，传统统计方法难以捕捉。神经网络模型虽然在风速预测上效果不错，但训练和调优过程会产生很高的能耗，影响模型本身的可持续性。因此，需要探索新的计算模式，在保持高性能的同时降低资源消耗。

与此同时，研究者发现，量子计算能够加速计算并显著降低能耗，理论上可以有效解决上述问题。基于此，论文提出的核心问题即在当前技术条件下，一个纯量子机器学习模型能否在与经典模型的对比中展现出竞争力，成为绿色AI研究的关键方向。

1.2 方法论

本文提出了一套完整的、从数据处理到预测评估的量子神经网络风速预测流程，主要包括量子模型架构与训练评估两个部分。

在量子模型架构上，遵循变分量子算法框架，包括数据准备、数据处理与数据输出三个步骤。其中，数据准备由 H 门和旋转门构成，首先通过 H 门为每个特征对应的量子比特创建均匀叠加态，再将旋转门应用于每个量子比特，角度由归一化的经典输入直接参数化得到；数据处理包括 L 层的变分算子与纠缠算子（论文最多 5 层），变分算子将门序列应用于第 k 层的每个量子比特，纠缠算子则是在相邻量子比特之间应用受控非门来实现，其示意图如下所示：

数据输出则是对所有量子比特进行测量，得到期望值，并将它们送入一个包含6个神经元（对应未来1至6小时）的全连接经典层，通过 ReLu 激活函数进行线性变换，得到最终的风速预测值。

在训练和评估上主要包括三个部分。一是与迭代预测的多层感知机（MLP）进行对比；二是利用均方根误差、皮尔逊相关系数和 Fac2 来量化性能；三是采用 Wilcoxon 符号秩检验，来评估不同深度的QNN模型之间的预测分布是否存在统计上的显著差异。

1.3 创新点

本文创新点也主要是架构上的创新，首次在风速预测任务中提出了纯量子神经网络模型，而非混合经典-量子模型，同时还设定了一套完整的评估流程。实验上，不仅将 QNN 与经典 MLP 在同一数据集上进行比较，还引入 Wilcoxon 符号秩检验，对不同深度的量子模型进行统计显著性分析，增强了结论的可靠性。

1.4 实验结果及分析

实验主要包括与 MLP 的性能对比与电路深度的效果观察**。**

总体而言，QNN 与 MLP 性能相当。相较于 MLP，QNN 的 RMSE 略逊一筹， Pearson R 仅一个实例表现更好，在 Factor of 2 指标上则均为更优。同时，QNN 在训练和验证过程中表现出良好的收敛性，没有出现明显的欠拟合或过拟合现象，显示出较好的泛化潜力。

关于电路深度则发现，增加 QNN 的深度并不一定带来精度的提升。这一方面表明在该任务中，模型性能对深度增加不敏感或很快饱和，较为简单的量子结构可能就已足够；另一方面也可能意味着量子模型的计算资源可能会更明智地分配给其他方面，而不仅仅是深度。

2 补充

本节进行补充学习。

2.1 量子电路仿真

量子算法的开发和测试可以通过在实际量子硬件上执行或在经典计算机上模拟两个主要途径实现，后者就被称为量子电路仿真。在实际量子硬件上执行可以充分发挥量子加速的优势，但可能带来严重的资源限制、算法开发复杂化、访问时间较长等问题；而仿真则能够忽略硬件资源的限制，尽管无法带来真正的量子优势，它依然成为了开发和验证量子算法的主要手段。

在模拟给定量子电路时，计算资源可能有很大差异，会影响仿真方法的选择。仿真方法具体包括状态向量仿真、张量网络仿真、比特模拟等。

其中状态向量仿真是最直接的方法，它会把量子态存成一个完整向量，把量子门存成矩阵，然后通过矩阵乘法来模拟电路，精确但非常消耗内存，因为量子态的大小会随比特数指数级增长；张量网络相较而言就更加智能，它会利用量子态的特定数学结构进行压缩以突破内存限制，对于纠缠度不高的量子态，其存储和计算开销极大降低，但效率也会随电路产生纠缠量的增加而下降；比特模拟则与前两种方法的思想都不太一样，不模拟量子态的全局数学结构，而是模拟测量时量子态的行为，计算时间主要随电路中真实存在的叠加和纠缠状态的复杂性而指数增长，比较适用于叠加和纠缠程度有限，但比特数可能较多的电路。

2.2 量子模型分类

与量子相关的算法架构通常会根据数据与处理数据的主体分别是经典还是量子来进行划分，分别包括 CC、CQ、QC、QQ 四种。

其中 CC 就代表经典数据加经典计算模式，通常指传统机器学习的全部领域，完全与量子无关，是量子算法要挑战的基准线；QC 代表量子数据与经典计算，即用经典计算机分析量子态，例如，量子设备产生了一个量子态，然后用经典算法通过测量结果反推该状态；CQ 代表经典数据与量子计算，这也是当前的主流范式，即将经典数据编码进量子处理器，再进行计算，前面论文中提出的模型就属于这一类别；QQ 则代表量子数据与量子计算，是全量子原生算法**，**输入本身就是量子态，处理也全程在量子处理器上完成。

3 总结

本周阅读的论文主要是提出了一种纯量子模型，不同上周论文的量子核嵌入，它除了输入和输出部分外均由量子构成，同时提供了复现代码，下周可以尝试复现一下，整体架构较简单，后续可以考虑作为基线模型，但补充学习比较浅显，下周考虑进行深入一点的学习，同时对本篇论文提到的评估方法，如 Wilcoxon 符号秩检验等，进行了解。