目录
[1 论文阅读《Quantum Convolutional Long Short-Term Memory Based on Variational Quantum Algorithms in the Era of NISQ》](#1 论文阅读《Quantum Convolutional Long Short-Term Memory Based on Variational Quantum Algorithms in the Era of NISQ》)
[1.1 背景](#1.1 背景)
[1.2 方法论](#1.2 方法论)
[1.3 创新点](#1.3 创新点)
[1.4 实验结果及分析](#1.4 实验结果及分析)
[2 总结](#2 总结)
摘要
本周主要阅读了《Quantum Convolutional Long Short-Term Memory Based on Variational Quantum Algorithms in the Era of NISQ》这篇论文,了解了利用量子卷积与LSTM结合学习时空特征的方法,主要包括架构设计、不同数据编码方式及分层树状结构的量子电路设计。
Abstract
This week, I mainly read the paper titled "Quantum Convolutional Long Short-Term Memory Based on Variational Quantum Algorithms in the Era of NISQ" and learned about the method of combining quantum convolution with LSTM to learn spatiotemporal features, which primarily includes architecture design, different data encoding methods, and the design of quantum circuits with a hierarchical tree structure.
1 论文阅读《Quantum Convolutional Long Short-Term Memory Based on Variational Quantum Algorithms in the Era of NISQ》
论文链接如下:
1.1 背景
天气预报是一项涉及对大量时空数据进行建模与预测的复杂任务。传统方法主要依赖于物理模型和统计方法,然而,这些方法在捕捉复杂的时空动态特征和处理非线性数据方面存在明显的局限性。
LSTM能够有效捕捉时间序列数据中的长期依赖性并缓解梯度消失问题,但其网络结构复杂,训练复杂度高,参数量大,也难以处理高维空间数据。2015年,有研究者提出ConvLSTM结构,将卷积嵌入LSTM门控结构中,使模型同时学习时间与空间特征,由此在雷达降雨预测、天气预报等领域得到了广泛应用。
与此同时,随着量子机器学习的兴起,研究者开始探索将量子与网络模型相结合,比如量子长短期记忆网络就是利用量子的叠加、纠缠及并行计算能力来替代部分经典神经网络计算。它相比经典LSTM具有收敛更稳定、参数更少以及理论计算能力更强的优势。但大多数的QLSTM采用量子全连接结构,无法学习图像局部空间关系,同时大部分默认理想量子环境,忽略现实中的量子噪声,缺乏现实意义。
1.2 方法论
为解决传统QLSTM在学习数据空间特征方面缺乏的问题,研究提出了基于量子卷积神经网络(QCNN)结构的QConvLSTM模型,核心思路就是用QCNN替代QLSTM中的量子全连接层,具体包括架构设计、数据编码与电路结构三个部分。
在架构设计方面,主要是在LSTM单元的输入到状态和状态到状态的转换中,用量子卷积电路层替换传统QLSTM中的量子全连接电路层以编码空间信息;
在数据编码方面,采用振幅编码方式以适应当前有限的量子比特资源;
在电路结构方面,则设计了基于分层树状结构的量子卷积电路。通过多组双量子比特变分量子电路(VQC)模块的组合与逐层量子比特丢弃操作,模拟经典CNN的卷积与池化过程,最终仅测量单量子比特的期望值。
1.3 创新点
研究创新点主要如下:
第一、针对QLSTM缺乏空间特征学习能力的问题,首次将量子卷积神经网络(QCNN)结构引入LSTM,使模型在保留时间建模能力的同时增强了空间特征提取,具备了时空特性。
第二、采用分层树状结构的VQC设计,利用量子计算的并行性,减少了对量子比特数量和电路深度的依赖,降低了参数量并提升了训练效率。
第三、不同于以往研究对噪声的忽视,本文专门设计了噪声模拟实验,验证了模型对NISQ设备中常见非相干噪声的强鲁棒性。
1.4 实验结果及分析
研究主要做了与经典模型的对比、噪声的鲁棒性分析以及消融三个方面的实验。
在与经典模型的对比中发现,相比LSTM整体效果更好,说明其时空特征提取能力显著增强;而相比QLSTM的提升效果则发现,QCNN带来的收益大于单纯量子化收益。
在噪声的鲁棒性分析上,通过在添加位翻转、相位翻转、比特-相位翻转和去极化噪声进行模拟,发现QConvLSTM的性能指标与无噪声环境相比变化微小,证明其对常见噪声具有极强的鲁棒性。研究认为原因可能包括电路深度小;卷积结构增强特征提取,会自动补偿部分噪声;VQA本身具有天然噪声容忍性。
在消融实验中,两层电路结构在性能与复杂度之间取得了最佳平衡,三层略优但复杂度剧增,同时易引入噪声;在六种量子电路结构的对比中,标记为(c)的设计表现最优。
2 总结
总的来说,本周阅读的论文实验效果还不错,用QCNN代替了以前的量子全连接层,但也存在部分不足,比如实验和量子的规模都比较小,也没有训练时间的对比。下周打算正式开始复现一下前面的几个模型,感觉之前一直在立flag或者弄个开始没弄了,还是得实践一下。