深度学习周报（4.20~4.26)

[1 文献阅读《Quantum Kernel-Based Long Short-term Memory for Climate Time-Series Forecasting》](#1 文献阅读《Quantum Kernel-Based Long Short-term Memory for Climate Time-Series Forecasting》)

[1.1 背景](#1.1 背景)

[1.2 方法论](#1.2 方法论)

[1.3 创新点](#1.3 创新点)

[1.4 实验结果及分析](#1.4 实验结果及分析)

[2 补充](#2 补充)

[2.1 旋转门与CNT门](#2.1 旋转门与CNT门)

[2.1.1 旋转门](#2.1.1 旋转门)

[2.1.2 CNT 门（CNOT)](#2.1.2 CNT 门（CNOT))

[2.2 参数移位规则](#2.2 参数移位规则)

[3 总结](#3 总结)

摘要

本周主要阅读了《Quantum Kernel-Based Long Short-term Memory for Climate Time-Series Forecasting》这篇论文，主要了解了将量子核嵌入LSTM的方法，回顾了量子计算中旋转门与 CNOT 门的相关知识，同时学习了在实际应用中计算量子梯度的方法，即参数移位规则。

Abstarct

This week, I mainly read the paper titled "Quantum Kernel-Based Long Short-term Memory for Climate Time-Series Forecasting," primarily understanding the method of embedding quantum kernels into LSTM. I reviewed relevant knowledge about rotation gates and CNOT gates in quantum computing, and also learned the method for computing quantum gradients in practical applications, namely the parameter shift rule.

1 文献阅读《Quantum Kernel-Based Long Short-term Memory for Climate Time-Series Forecasting》

链接：基于量子核的气候时序长短期记忆 |IEEE会议出版物 |IEEE Xplore

1.1 背景

气候时间序列预测（本文主要是 AQI 指数预测）对于应对具有深远社会影响的环境挑战（如公共卫生）至关重要，同时相较一般的神经网络而言，RNN 与 LSTM 的序列建模能力更为出色，但面对高维、异质性强的气候数据，其计算需求还是会飞速增加。

p.s. AQI 指数，即空气质量指数（Air Quality Index），是一个用来将复杂、不同种类的空气污染物浓度，统一成一个简单直观的数字和等级的指标，其数值越大，污染越严重，对健康危害也越大。

而在关于量子计算的学习中，可以发现量子计算能高效地处理高维数据，具有变革潜力。一些研究尝试将变分量子电路嵌入LSTM，但其复杂的电路设计、漫长的训练和量子比特退相干等又使其面临着硬件的限制。

基于此，本文提出利用量子核方法作为替代方案，其核心思想是：把经典数据映射到高维的量子特征空间，并在该空间中高效计算数据点之间的相似度（即核函数），从而再捕捉复杂的非线性关系的同时提升量子部分的训练稳定性，并达到减少参数量的目的。

1.2 方法论

本文方法论的核心思想就是用量子核映射替代传统 LSTM 门控机制中的线性变换机制，具体包括数据预处理、量子核嵌入、量子核内部计算与训练优化四个部分。

在数据预处理方面，主要是 AQI 指数的计算、异常检测与缺失处理。模型使用印度班加罗尔 2015-2020 年的每日 AQI 数据，选取了11种污染物作为特征；为了反映选定特征中最关键的污染物浓度，AQI 计算公式如下：

异常检测采用 Z 分数筛选出异常值并去除，最后采用线性插值对原本就存在以及异常检测中去除的缺失值进行补充处理。

在量子核嵌入方面，如核心思想所讲，用量子核映射替代 LSTM 门控机制中的线性变换，具体如下示意图：

而对于量子核内部计算，量子核函数主要衡量由量子特征映射诱导的量子特征空间中两个数据点之间的相似性。其量子电路大致如下：首先经过初始化与哈达玛门（H 门），生成叠加态的量子比特；其次，基于数据通过对应的旋转门进行编码；最后，通过 CNOT 门引入纠缠。

在训练方面，对于神经网络模型，主要通过反向传播训练经典参数；对于量子电路部分则使用参数移位规则来计算梯度。

1.3 创新点

本文创新点主要就是架构上的创新，将量子核嵌入 LSTM 网络。一方面在发挥传统 LSTM 序列建模能力优势的同时减少了训练的参数量，另一方面用量子核技巧替代变分电路训练，避开了复杂量子电路的优化难题，更适合当前硬件，是纯粹的量子机器学习应用。

1.4 实验结果及分析

实验主要就是经典 LSTM 与本文提出的 QK-LSTM 进行对比，主要对比模型效果与训练的参数量两个部分。

在模型效果上，对比经典 LSTM，QK-LSTM 三项核心误差指标均大幅降低，其中 RMSE 从 15.94 降至 9.2，MAE 从 11.07 降至 7.15，MAPE 从 13.32% 降至 9.14%。除此之外，也从 0.78 提升至 0.84。同时，从下面论文的预测曲线图（如下）来看，QK-LSTM 的预测曲线与真实值的拟合度更高，尤其是在 AQI 出现剧烈波动的尖峰和低谷处，这表明它对时序数据的动态变化更敏感。

在参数量上，传统LSTM需要1873个参数，而QK-LSTM仅需209个，压缩率达88.84%。

2 补充

本节主要对量子部分的相关知识进行补充学习。

2.1 旋转门与CNT门

2.1.1 旋转门

在量子计算中，旋转门（也称泡利门）是在布洛赫球面上绕特定轴旋转量子比特状态的单量子比特门，其旋转角度通常由输入数据决定。

比如，若它绕 Y 轴旋转角度，其矩阵形式为：

若绕 Z 轴则为：

在论文中的量子电路设计部分，它被用作数据编码，即在通过初始化与 h 门将原输入向量映射为叠加态的量子比特后，根据输入数据对每个量子比特先后进行绕 y 轴与 x 轴的旋转，从而将经典信息编码到量子比特的振幅或相位中。

2.1.2 CNT 门（CNOT)

CNOT（受控非门）是两量子比特门，包括一个控制量子比特与一个目标量子比特，若控制比特为，则目标比特翻转（即），否则不变，其矩阵表示为：

它主要用于在量子比特之间产生纠缠，是构建复杂量子态的关键操作。在论文中，主要是在通过数据编码的、相邻的量子比特之间依次进行施加，使单比特的编码信息通过纠缠扩散到整个量子系统，从而表达经典数据中复杂的非线性关系。

2.2 参数移位规则

训练神经网络需要梯度来更新参数，但对于量子电路，由于线路在真实硬件上运行时，其内部状态无法直接观测，其梯度无法直接通过反向传播计算，因此论文中才用参数移位规则来精确获取量子部分的梯度。

参数移位规则（Parameter-Shift Rule, PSR）的精髓在于，对于满足特定条件的参数化量子门，期望值的梯度可以通过计算该电路在原始参数值附近两个对称偏移点上的期望值之差来精确获得，主要适用于由单参数泡利旋转生成元构成的量子门。

对于由任意泡利矩阵生成的旋转门，标准的 PSR 公式为：

这个公式也意味着，要计算参数处的梯度，只需要运行两次电路：一次将增加，另一次减少，然后计算它们输出期望值之差的一半即可。

随着量子计算的发展，PSR也从最初的简单形式发展出多个重要的变体，如随机参数移位规则、广义参数移位规则、二阶参数移位规则等等，它们的共同目标都是力求在保持梯度计算精确性的同时，简化计算过程并降低资源消耗。总而言之，参数移位规则提供了在真实量子硬件上计算梯度的实用方案，是训练参数化量子电路的核心技术。

3 总结

本周阅读的论文主要是提供了一种用量子核替代原有的线性变换从而在神经网络中运用量子技术的方法。通过这篇论文初步了解了量子如何应用于神经网络，但感觉这周包括前面都是在读论文或者学习方法，略微有点悬浮。可能下周会找一篇能够复现的、与本周阅读的论文技术相关的文章进行阅读，降低理解难度，拓展方法思路。并尝试进行复现。