2025.12.13 论文阅读
- 一、文献阅读
一、文献阅读
题目信息
题目: 《A quantum neural network model for short term wind speed forecasting using weather data》
期刊: Energy and AI
作者: Otto Menegasso Pires, Erick Giovani Sperandio Nascimento, and Marcelo A. Moret
发表时间: 2025
文章链接: https://doi.org/10.1016/j.egyai.2025.100588
摘要
本文提出了一种用于短期风速预测的新型纯量子神经网络模型。针对风速预测中计算智能模型训练能耗高的问题,作者研究了量子计算在减少能源消耗方面的潜力。研究利用来自巴西巴伊亚州三个不同城市、不同高度的气象塔数据,构建并评估了该QNN模型。通过与经典的基线多层感知机模型进行对比,实验结果表明,该QNN模型在RMSE、Pearson相关系数和Fac2指标上表现出具有竞争力的性能,且泛化能力强,未出现欠拟合或过拟合现象。这项工作验证了量子机器学习在可再生能源预测中的可行性,为未来在真实量子硬件上实现更高效的绿色AI预测奠定了基础。
创新点
- 不同于以往的混合模型,本文设计了一个完整的"数据准备-量子处理-数据输出"的纯量子机器学习流程,能够处理多变量气象输入并预测未来6小时的风速。
- 研究发现,并不一定需要深层的量子线路才能获得最佳结果,浅层Ansatz足以有效学习数据分布。这一发现对于在当前的噪声中尺度量子设备上部署模型具有重要意义,因为它意味着可以使用更少的资源实现有效预测。
- 模型在巴西三个不同气候特征的地区以及风力发电机典型的轮毂高度进行了严格测试,证明了该架构在不同场景下的通用性和稳定性。
网络框架
本文提出的量子神经网络模型遵循经典的变分量子算法结构,主要由数据输入、数据处理和数据输出三个阶段组成。
1. 整体模型流程
模型接收经过归一化处理的历史气象数据,如风速、风向、温度等,通过特征映射编码到量子态中。随后,量子态通过由多层纠缠算符和变分算符组成的量子电路进行演化。最后,通过对量子比特的测量获取期望值,并经过一个经典的线性层输出未来1至6小时的风速预测值。

展示了从数据输入:特征映射 U ( x ) U(x) U(x)
数据处理:重复 L L L 次的纠缠算符 U e n t U_{ent} Uent 和变分算符 U v a r U_{var} Uvar
数据输出:测量及全连接层的完整管道结构量子模型的视觉表示。
2. 特征映射 (Feature Map)
为了将经典数据编码为量子态,模型设计了一个两阶段的特征映射电路。
- 叠加层:首先对所有量子比特应用Hadamard门,创建初始叠加态。这有助于减少后续Ansatz所需的层数。
- 角度编码层 :对每个量子比特 j j j 应用 R y ( θ j ) R_y(\theta_j) Ry(θj) 旋转门,其中旋转角度由归一化的经典输入特征 x j x_j xj 决定。

特征映射电路图。左侧为叠加层(H门),右侧为角度编码层( R y ( x ) R_y(x) Ry(x)),为数据集中的每个特征分配一个量子比特
3. Ansatz (参数化量子电路)
核心处理单元是一个分层结构的Ansatz,重复 L L L 次。每一层包含:
- 纠缠算符 (Entanglement Operator):采用并行的CNOT门方案,先在偶数索引与其后续奇数索引量子比特间作用,再在奇数索引与其后续偶数索引间作用,以产生量子纠缠。
- 变分算符 (Variational Operator) :对每一层的每个量子比特应用 R z ( θ ) R y ( ϕ ) R z ( ω ) R_z(\theta)R_y(\phi)R_z(\omega) Rz(θ)Ry(ϕ)Rz(ω) 旋转序列,这些角度是可训练的参数。

量子神经网络模型的Ansatz结构。展示了由参数化向量 θ , ϕ , ω \theta, \phi, \omega θ,ϕ,ω 定义的变分算符 U v a r U_{var} Uvar,以及其前置的并行纠缠算符 U e n t U_{ent} Uent
实验结果
为了验证模型的有效性,作者使用了 RMSE、Pearson's R(皮尔逊相关系数)和 Fac2(两倍因子)作为评估指标,并与基于之前研究的基线 MLP 模型进行了对比。
实验一:预测性能与区间估计
实验结果显示,QNN 模型在各项指标上与 MLP 相当。尽管在 RMSE 上略逊一筹,但在 Fac2 指标上,QNN 在所有测试实例中均优于 MLP,且在部分实例中具有更高的相关系数。

展示了 Mucuri 地区 100m 高度处,使用 2 层 Ansatz 的 QNN 模型对未来 1小时、3小时和 6小时风速的预测区间与实际值的对比,显示出模型能够很好地捕捉风速的波动趋势。
实验二:训练收敛性与泛化能力

通过分析训练过程中的 Loss 曲线,发现所有不同深度的 QNN 模型都表现出相似的收敛模式。训练损失和验证损失同步下降并趋于稳定,且两者差距很小。这表明提出的量子模型具有很强的泛化能力,未出现欠拟合或过拟合现象。
实验三:电路深度对性能的影响分析
研究使用了 Wilcoxon 符号秩检验来分析不同电路深度对预测分布的影响。

结果表明,增加电路深度并不一定能带来性能的提升,不同深度的模型预测结果存在统计学显著差异,但浅层模型,如1-2层,往往能提供足够好甚至更优的结果。这意味着在风速临近预报任务中,计算资源可以更明智地分配给其他优化方面,而非单纯增加深度。
结论
本研究成功开发并评估了一种用于短期风速预测的纯量子神经网络模型。该模型在三个不同地理位置和高度的数据集上表现出了与经典 MLP 模型相当的预测精度,特别是在 Fac2 指标上表现优异,且具有出色的泛化能力。研究证明了浅层量子电路在处理此类复杂气象时间序列上的有效性,为量子机器学习在可持续能源领域的应用提供了重要的实证依据。
不足与展望
- 硬件验证缺失。当前的研究完全基于经典计算机上的量子模拟器进行,未能直接量化在真实量子硬件上运行时的实际能耗优势和计算加速效果。
- 噪声影响。模拟环境未完全反映真实量子设备中的噪声干扰。未来的工作需要在真实的NISQ设备上评估模型的鲁棒性。
- 模型复杂度的扩展。目前的对比基线主要集中在 MLP。未来可以探索更复杂的量子特征映射和混合架构,并将基准扩展到更先进的经典模型,如 Transformer 或 LSTM等模型进行对比。