论文阅读--Variational quantum algorithms

文献类型：期刊论文

作者：M. Cerezo（Los Alamos National Laboratory）

年份：2021

期刊：Nature

影响因子：44.8

摘要：由于计算成本极高，模拟复杂量子系统或解决大规模线性代数问题等应用对于传统计算机来说极具挑战性。量子计算机有望提供解决方案，尽管容错量子计算机在不久的将来可能不会出现。当前的量子设备存在严重的限制，包括有限的量子比特数量和限制电路深度的噪声过程。变分量子算法 (VQA) 使用经典优化器来训练参数化量子电路，已成为解决这些限制的主要策略。VQA 现已被提议用于研究人员为量子计算机设想的所有应用，它们似乎是获得量子优势的最大希望。然而，挑战仍然存在，包括 VQA 的可训练性、准确性和效率。在这里，我们概述了 VQA 领域，讨论了克服其挑战的策略，并强调了使用它们获得量子优势的激动人心的前景。

图 1. 变分量子算法 (VQA) 的示意图。VQA 的输入包括：成本函数 C(θ)，其中 θ 是一组编码问题解决方案的参数，一个其参数经过训练以最小化成本的假设，以及（可能）一组在优化过程中使用的训练数据 {ρk}。在这里，对于某些函数集 {fk}，成本通常可以表示为方程 (3) 中的形式。此外，假设显示为参数化的量子电路（左侧），类似于神经网络（右侧也以示意图显示）。在循环的每次迭代中，人们使用量子计算机来有效地估计成本（或其梯度）。此信息被输入到经典计算机中，该计算机利用优化器的功能来导航成本格局 C(θ) 并解决方程 (1) 中的优化问题。一旦满足终止条件，VQA 就会输出问题解决方案的估计值。输出的形式取决于手头的精确任务。红色框表示一些最常见的输出类型。

（1）

VQA 的标志是它们使用量子计算机来估计成本函数 C(θ)（或其梯度），同时利用经典优化器的功能来训练参数 θ。

（2）

其中 f 是某个函数，U (θ) 是参数化的幺正函数，θ 由离散参数和连续参数组成，{ρk} 是来自训练集的输入状态，{Ok} 是一组可观测量。

（3）

对于某些函数集 {fk}。请注意，手头的任务将决定方程 (2) 中 f 的选择或方程 (3) 中 {fk} 的选择。在优化过程中，人们使用成本或其梯度的有限统计估计量。C(θ) 的最小值对应于问题的解。其次，必须能够通过在量子计算机上进行测量并可能执行经典后处理来"有效估计"C(θ)。这里的一个隐含假设是成本不应该用经典计算机有效计算，因为这意味着 VQA 无法实现任何量子优势。此外，C(θ) 具有"操作意义"也很有用，因此较小的成本值表示更好的解决方案质量。最后，成本必须是"可训练的"，这意味着应该能够有效地优化参数 θ。我们稍后将更详细地讨论 VQA 的可训练性问题。对于要在 NISQ 硬件中实现的给定 VQA，用于估计 C(θ) 的量子电路必须保持电路深度和辅助要求较小。这是因为 NISQ 设备容易出现门错误，量子比特数有限，并且这些量子比特的退相干时间较短。因此构建高效的成本评估电路是 VQA 研究的重要方面。

对于要在 NISQ 硬件中实现的给定 VQA，用于估计 C(θ) 的量子电路必须保持电路深度和辅助电路要求较小。这是因为 NISQ 设备容易出现门错误，量子比特数有限，并且这些量子比特的退相干时间较短。因此，构建高效的成本评估电路是 VQA 研究的一个重要方面。

假设电路

VQA 的另一个重要方面是其假设。一般来说，假设的形式决定了参数 θ 是什么 ，因此，如何训练它们以最小化成本。假设的具体结构通常取决于手头的任务，因为在许多情况下，人们可以使用有关问题的信息来定制假设。这些就是所谓的"问题启发式假设"。然而，一些假设架构是通用的和"问题无关的"，这意味着即使没有相关信息可用，也可以使用它们。对于等式 (3) 中的成本函数，参数 θ 可以编码为应用于量子电路输入状态的酉 U (θ)。如图 2 所示，U (θ) 可以一般地表示为 L 个顺序应用的酉的乘积。

（4）

（5）

这里 Wm 是非参数化的幺正函数，Hm 是厄米算子；θl是 θ 中的第 l 个元素。下面我们将介绍文献中一些最广泛使用的假设，首先是那些可以表示为方程 (4) 的假设，然后介绍更通用的架构。

1 硬件高效假设（Hardware efficient ansatz）

硬件高效假设是用于减少使用给定量子硬件时实现 U (θ) 所需电路深度的假设的通用名称。这里使用从门字母表（量子门集）中获取的幺正和，该字母表由特定于量子硬件的连接和相互作用确定 ，从而避免了将任意幺正转换为可在设备中轻松实现的门序列而产生的电路深度开销 。硬件高效假设的主要优势之一是其多功能性，因为它可以适应编码对称性 并使相关量子比特更接近以减少深度，并且特别适用于研究与设备相互作用类似的哈密顿量。例如，局部自旋哈密顿量就是这种情况，尽管在这种情况下，已经启发式地表明，在临界附近，假设需要与系统大小成比例的深度。此外，"分层"硬件高效假设（其中门作用于砖状结构中交替的量子比特对）已被广泛用作问题无关的架构。然而，当随机初始化时，这种假设可能会导致可训练性问题。

2 酉耦合聚类假设（Unitary coupled clustered ansatz）

酉耦合 (UCC) 假设是一种问题启发式假设，广泛应用于量子化学问题，其目标是获得费米子分子哈密顿量 H 的基态能量。UCC 假设基于激发某个参考态 |ψ0〉（通常是 H 的 Hartree-Fock 态）提出了此类基态的候选者，即 eT (θ)−T (θ)† |ψ0〉。其中，T = ∑ k Tk 是簇算子 [15, 16]，Tk 是激发算子。

在所谓的 UCCSD 假设（SD 4 代表单和双）中，求和被截断为包含单激发

和双激发

其中 {a† i } ({ai}) 是费米子产生（湮灭）算符。为了在量子计算机中实现这个假设，人们使用 Jordan-Wigner 或 Bravyi-Kitaev 变换将费米子算符映射到自旋算符，从而得到形式为方程 (4) 的假设。UCC 假设有许多变体，其中一些通过考虑更有效的费米子算符编译方法来减少电路深度。

3 量子近似优化算法 (QAOA)

量子近似优化算法 (QAOA) 最初是为了获得组合优化问题的近似解而引入的。QAOA 中使用的假设涉及交替结构，通常称为量子交替算子假设，与算法的首字母缩写相同（尽管我们将在本篇评论中使用 QAOA 来指代该算法）。文献首次证明了该假设对于某些汉密尔顿量具有计算通用性 ，文献将其通用性的证明推广到由图集和超图定义的假设族。QAOA 中的假设受到 Trotter 化绝热变换的启发，其中 Trotter 化的阶数 p 决定了解的精度。该假设的目标是通过依次应用问题幺正 e−iγlHp 和混合器幺正 e−iβlHM ，将输入状态 |ψ0〉映射到给定问题哈密顿量 HP 的基态，其中 HM 是埃尔米特算子，称为混合哈密顿量参考文献。具体而言，该假设采用以下形式：U (γ, β) = ∏p l=1 e−iβlHM e−iγlHP ，其中 θ = (γ, β)。该假设自然具有公式 (4) 中的形式，尽管将这些幺正分解为本地门可能会导致电路过长，这是由于 HP 中的多体项和有限的设备连接性造成的。该假设的优势之一是某些问题的可行子空间小于整个希尔伯特空间，这种限制可能会产生性能更好的算法。

4 变分哈密顿量设想

变分哈密顿量设想受 QAOA 设想的启发，变分哈密顿量设想也旨在通过 Trotter 化绝热态制备过程，为给定哈密顿量 H = ∑ k Hk（其中 HK 是厄米算子，通常是泡利弦）准备试验基态。这里，每个 Trotter 步骤对应一个变分设想，使得幺正由 U (θ) = ∏ l(∏ k e−θl,kHk ) 给出，并且再次具有公式 (4) 的形式。由于其多功能性，变分哈密顿量设想已经应用于量子化学、最优化和量子模拟问题 。

5 变结构设想

变结构设想在许多设想中，人们针对连续参数（如旋转角度）进行优化，而电路结构保持固定。虽然这能够控制整个电路的复杂性，但可能会错过通过优化电路结构本身（包括添加或删除不必要的电路元素）实现的改进。优化电路结构最初是在一个名为 ADAPT-VQE的框架中进行探索的，该框架旨在自适应地向假设中添加特定元素，以最大限度地提高效益，同时最大限度地减少量子化学应用中的电路元素数量。（参考文献 [32, 33] 介绍了对 ADAPT-VQE 的改进和用于量子化学的可变假设，参考文献介绍了 QAOA 假设的可变结构版本。）然后可以将这个问题看作一个稀疏模型问题，虽然这种优化众所周知很难，但尝试一次添加一个项的启发式或贪婪近似已被证明是有帮助的。参考文献中也探索了用于电路设计的机器学习辅助进化算法。其中升级种群中的个体（量子电路）以扩大电路并探索希尔伯特空间。此外，参考文献使用机器学习工具为各种 VQA 应用开发变分假设。基于同时探索不同假设变体作为不断发展的群体的互补方法也表现出良好的性能.

6 亚逻辑拟设和量子最优控制

亚逻辑拟设和量子最优控制参数 θ 通常在逻辑电路级指定（如旋转角度），但有时它们可以直接转换为逻辑级以下的设备级参数。因此，可以在拟设的定义中包含这些设备级参数，因为这样可以提供额外的灵活性。这种方法还与量子最优控制的思想建立了联系，量子最优控制通常用于确定从逻辑参数到物理设备参数的转换，特别适用于量子模拟。参考文献探索了使用 VQA 构建最优控制序列。虽然这会增加参数的数量，但额外的灵活性可以实现即时校准效果，这已被证明可以减少相干噪声的影响。

7 混合拟设

混合拟设在某些情况下，可以将量子拟设与经典策略相结合，将部分复杂性转移到经典设备上。例如，在量子化学中，可以利用自由费米子动力学的经典可模拟性，通过经典后处理应用量子操作。另一种方法是使用可训练的参数化状态 |ψ({cμ}, θ)〉 = ∑ μ cμ|ψμ(θμ)〉的线性组合作为拟设，其中 {cμ} 为经典可优化系数。此外，鉴于量子电路可以看作张量网络，将现有的张量网络技术与量子拟设结合起来是很自然的。例如，已经证明可以在量子计算机上酉收缩张量网络。提出了一种通过深度变分量子特征值求解器进行的替代混合方法，其中算法将整个系统划分为小的子系统，然后依次求解每个子系统及其之间的相互作用。最后，还有一种混合方法，将变分蒙特卡罗技术与量子拟设相结合，将所谓的 Jastrow 算子 e(∑ i,j Jij σiσj )（J 为对称矩阵，σi 和 σj 为 Pauli 算子）经典地应用于参数化量子态 |ψ(θ)〉，目的是通过同时优化 J 和 θ 获得更准确的结果（参考文献）。

混合态的拟设由于混合态在有限温度系统等许多应用中发挥着重要作用，因此已经开发出几种拟设来构造 n 个量子比特的混合态 ρ=∑ i pi|ψi〉〈ψi|（这里 pi 是 ρ 的特征值，使得 ∑ i pi = 1）。第一种方法（代价是需要多达 2n 个量子比特）是基于准备一个纯态，该纯态在某些量子比特子系统中以 ρ 为还原态。参考文献 [65, 70] 提出了一种方法来变分获得 ρ 的纯化 |ψ〉 = ∑ i √pi|ψi〉|φi〉，而参考文献 [71] 介绍了一种构造状态 |ρ〉 = 1 c ∑ i pi|ψi〉|ψi〉的方法，其中归一化 c = ∑ i p2 i 。或者，也可以训练概率分布 {pi(φ)} 和一组状态 {|ψi(θi)〉} 来构建 ρ 作为统计集合 ρ(φ, {θi}) = ∑ i pi(φ)|ψi(θi)〉〈ψi(θi)|。参考文献 [71] 介绍了一种构造状态 |ρ〉 = 1 c ∑ i pi|ψi〉|ψi〉的方法，其中归一化 c = ∑ i p2 i 。或者，也可以训练概率分布 {pi(φ)} 和一组状态 {|ψi(θi)〉} 来构建 ρ 作为统计集合 ρ(φ, {θi}) = ∑ i pi(φ)|ψi(θi)〉〈ψi(θi)|。建议使用基于物理见解的简单乘积分布，而参考文献介绍了一种更通用的基于能量的模型。最近，有一项提议使用自回归模型来生成混合态。

8 拟设可表达性

拟设可表达性鉴于可使用的拟设范围很广，一个相关的问题是，给定的架构是否可以通过优化其参数来准备目标状态。从这个意义上讲，有多种方法可以判断拟设的质量，方法是考虑两个不同的概念：拟设的可表达性和纠缠能力。如果电路可用于均匀地探索整个量子态空间，则拟设是可表达的。因此，量化拟设 U (θ) 可表达性的一种方法是将从 U (θ) 获得的状态分布与最具表达力的均匀 (Haar) 状态分布 UHaar 进行比较。受此启发，电路的表达能力可通过 [74] ||A(t)||来衡量，其中 A(t)(U ) := ∫ dUHaar U ⊗t Haar|0〉〈0|(U † Haar)⊗t − ∫ dU U ⊗t|0〉〈0|(U †)⊗t 。（6）其他表达能力测度也可以考虑，文献进一步研究了不同拟设的表达能力。文献还引入了一种衡量拟设纠缠能力的指标，它量化了随机采样电路参数 θ 产生的状态的平均纠缠度。量化特定拟设的表达能力是一个活跃的研究领域，某些量子架构相对于经典架构表现出更高的表达能力（根据某些测度）。

梯度

一旦定义了成本函数和假设，下一步就是训练参数θ并解决方程（1）的优化问题。众所周知，对于许多优化任务，使用成本函数梯度（或高阶导数）中的信息可以帮助加快优化器的速度并保证其收敛。许多 VQA 的主要优势之一是，如下所述，人们可以分析评估成本函数梯度。

1 参数位移规则

为简单起见，我们考虑一个形式如公式 (3) 所示的成本函数，其中 fk(x) = x，令 θl 为 θ 中的第 l 个元素，它在假设中参数化一个幺正 eiθlσl。这里，σl 是泡利算子。令人惊讶的是，有一个硬件友好的协议来计算 C(θ) 对 θl 的偏导数，通常称为参数移位规则。明确地说，6 条参数移位规则指出，等式

(7)

其中 θ± = θ ± αel，对任何实数 α 都成立。这里 el 是一个向量，其第 l 个元素为 1，否则为 0。方程(7)表明，可以通过将第l个参数移动某个量α来求得梯度。注意，求得的精度取决于系数1/(2 sin α)，因为每个±α项都是通过对进行采样来求得的。该精度在α = π/4时最大，因为1/ sin α在此时最小。虽然参数移位规则可能类似于简单的有限差分，但它通过系数1/ sin α来求得参数的解析梯度。参数移位规则和有限差分的详细比较可在参考文献中找到。最后，可以利用链式法则从方程(7)得到更一般的fk(x)的梯度。

2 其他衍生品

成本函数的高阶导数可以通过直接扩展参数移位规则来求得。例如，通过两次应用参数移位规则，上例的二阶导数可以写成，在此省略。

，其中初始状态 |ψ0〉），有时用于复杂的优化算法和变分量子模拟（参见动态量子模拟部分）。由于诸如 ∂〈ψ(θ)| ∂θl ∂|ψ(θ)〉 ∂θ′ l 本质上是不同状态的重叠，这可以通过类似 Hadamard 检验的协议 [91] 来评估。然而，如参考文献 [93] 所示，这些也可以简化为参数移位技术。D. 优化器与任何变分方法一样，变分量子算法 (VQA) 的成功取决于所用优化方法的效率和可靠性。与 VQA 相关的经典优化问题通常是 NP 难的，因为它们涉及的成本函数可能有许多局部最小值 [94]。除了在复杂的经典优化中遇到的典型困难之外，事实表明，在训练 VQA 时还会遇到新的挑战。这些问题包括由于测量预算有限而导致的固有随机环境、硬件噪声和贫瘠高原的存在（见正文）。这导致了许多量子感知优化器的开发，其中最优选择仍然是一个活跃的争论话题。这里我们讨论了一些专为 VQA 设计或推广的优化器。为方便起见，我们将根据它们是否实现某种版本的梯度下降法将它们分为两类。

优化器

优化器与任何变分方法一样，变分量子算法 (VQA) 的成功取决于所用优化方法的效率和可靠性。与 VQA 相关的经典优化问题通常被认为是 NP 难问题，因为它们涉及的成本函数可能具有许多局部最小值 [94]。除了在复杂的经典优化中遇到的典型困难之外，事实证明，在训练 VQA 时可能会遇到新的挑战。这些问题包括由于测量预算有限、硬件噪声和贫瘠高原的存在而导致的固有随机环境等问题（参见正文）。这导致了许多量子感知优化器的开发，最佳选择仍然是一个活跃的争论话题。在这里，我们讨论了一些设计或推广用于 VQA 的优化器。为方便起见，这些优化器将根据它们是否实现某种版本的梯度下降分为两类。

1 梯度下降法

梯度下降法最常见的优化方法之一是按照梯度指示的方向进行迭代。鉴于这些梯度只有统计估计值，这些策略属于随机梯度下降 (SGD) 的范畴。从机器学习社区引入的一种 SGD 方法是 Adam，它可以调整优化过程中所采取的步骤的大小，从而获得比通过基本 SGD 获得的解决方案更高效、更精确的解决方案 [95]。受机器学习文献启发的另一种方法是调整每次迭代的精度（每次估计的采样次数）而不是步长，以节省所使用的量子资源 [96]。即使只进行一次采样，也可以获得偏导数的无偏估计量 [97]，因此在可以接受低精度的情况下调整采样次数可以显著降低算法的总体采样成本。另一种基于梯度的方法是基于模拟虚时间演化 [87]，或者等效地使用基于信息几何概念的量子自然梯度下降法 [88, 89]。标准梯度下降在参数空间的 l2（欧几里得）几何中沿最陡下降方向进行，而自然梯度下降则在具有度量张量的空间中进行，该度量张量编码了量子态对参数变化的敏感度。使用此度量张量通常可以加速梯度更新步骤的收敛，从而以更少的迭代次数达到给定的精度水平。该方法还得到了扩展，以考虑噪声的影响 [89]。

2 其他方法

另一种使用梯度但更新步骤比 SGD 更复杂的方法是元学习 [98]。在这种情况下，优化器通过训练神经网络来"学会学习"，以便根据具有类似优化问题的优化历史和当前梯度做出良好的更新步骤。由于所采取的更新步骤基于从类似成本函数中学习到的规则，因此这种元学习方法在用于常见优化类的新实例时具有很高的效率。在为不直接利用梯度的 VQA 提出的优化方法中，与 SGD 最密切相关的方法可能是同时扰动随机近似 (SPSA) 方法 [99]。SPSA 可以被视为梯度下降的近似，其中梯度由沿随机选择方向的有限差分计算的单个偏导数近似。因此，SPSA 已被提出作为一种有效的 VQA 方法，因为它避免了在每次迭代中计算许多梯度分量的开销。此外，已经证明，对于一组有限的问题，SPSA 的理论收敛速度（就函数调用次数而言）比使用有限差分的 SGD 更快 [99]。最后，另一种值得注意的无梯度方法已专门针对 VQA 开发，用于目标函数是运算符期望值的线性函数的问题，因此 C(θ) 可以表示为三角函数之和。利用这一见解，可以拟合对几个参数的函数依赖关系（其余参数保持不变），从而可以进行局部参数更新 [ 85, 100]。对所有参数或参数子集依次执行此类局部更新，然后对所有参数进行迭代，这样就可以得到一种无梯度且不依赖于超参数的优化方法。此外，已经提出了这种方法的变体，使用 Anderson 加速（一种将先前步骤的线性组合添加到每个新更新步骤的方法）来加速收敛。

变分算法的应用

A. 寻找基态和激发态

变分量子本征求解器
正交性约束的 VQE

3.子空间扩展方法

子空间 VQE
多态构建VQE

6.绝热辅助 VQE

7.加速 VQE

8.迭代方法

子空间方法

10.变分快进

模拟开放系统

B. 优化

到目前为止，我们已经讨论了将 VQA 应用于本质上是量子的任务，即寻找基态和模拟量子态的演化。在本节中，我们将讨论一种不同的可能性，即使用 VQA 解决经典优化问题 [126]。用于量子增强优化的最著名 VQA 是 QAOA [23]，最初是为了近似解决组合问题而引入的，如约束满足 (SAT) [127] 和最大切割问题 [128]。组合优化问题定义在二进制字符串 s = (s1, · · · , sN ) 上，其任务是最大化给定的经典目标函数 L(s)。QAOA 通过将每个经典变量 sj 提升为泡利自旋 1/2 算子 σz j ，将 L(s) 编码为量子哈密顿量 HP，以便目标是准备 HP 的基态。受量子绝热算法的启发，QAOA 用问题哈密顿量 HP 和适当选择的混合器哈密顿量 HM 之间的 p 轮交替时间传播取代绝热演化，如量子交替算子假设小节中所述，演化时间间隔被视为变分参数，并采用经典方法进行优化。因此，定义 θ = {γ, β}，成本函数为 C(γ, β) = 〈ψp(γ, β)|HP |ψp(γ, β)〉，其中 |ψp(γ, β)〉 = e−iβpHM e−iγpHP · · · e−iβ1HM e−iγ1HP |ψ0〉，(8) 其中 |ψ0〉是 HM 的基态。寻找最优值 γ 和 β 是一个难题，因为 QAOA 中的优化景观是非凸的，具有许多局部最优值 [129]。因此，人们付出了巨大的努力来寻找一个好的经典优化器，它需要尽可能少的量子计算机调用。人们研究了基于梯度的[130, 131]、无导数的[43, 132]和强化学习[133]方法，这仍然是一个活跃的领域，可以保证 QAOA 的良好性能。

C.数学应用

线性系统
矩阵向量乘法

3.非线性方程

4.因素分解

5.主成分分析

后面还有很多应用的方向，感兴趣的看论文。