十个公式撑起了整篇论文,发表于Physic Review Letters
监督式机器学习是基于已经分类的训练样本对新数据进行分类。在这项工作中,我们展示了支持向量机,一种优化的二进制分类器,可以在量子计算机上实现,其复杂度在向量的大小和训练示例的数量上是对数的。在传统采样算法需要多项式时间的情况下,获得了指数级的加速。这种量子大数据算法的核心是一种非稀疏矩阵幂运算技术,用于有效地对训练数据内积(核)矩阵进行矩阵反演。
结论
在这项工作中,我们已经证明了机器学习中一个重要的分类器,支持向量机,可以在特征大小和训练数据数量的算法复杂度上以量子力学的方式实现,从而提供了量子"大数据"算法的一个例子。支持向量机的最小二乘公式允许使用相位估计和量子矩阵反演算法。当训练数据核矩阵由相对较少的主成分主导时,量子算法的速度最大。我们注意到存在几种启发式抽样算法用于支持向量机,更一般地说,用于寻找低秩矩阵的特征值/向量。信息论论证表明,在没有先验知识的情况下,寻找低秩矩阵近似的经典下界为Ω(M) ,这表明最小二乘支持向量机也有类似的下界。除了加速之外,量子机器学习的另一个及时的好处是数据隐私。量子算法从不要求对每个训练样例的所有特征进行显式的O(mn)表示,而是以量子并行的方式生成必要的数据结构,即内积的核矩阵。一旦生成了核矩阵,训练数据的单个特征就对用户完全隐藏了。综上所述,量子支持向量机是一种重要的机器学习算法的有效实现。它在数据隐私方面也有优势,可以用作更大的量子神经网络的组成部分。这项工作得到了DARPA、NSF、ENI、GoogleNASA量子人工智能实验室和Jeffrey Epstein的支持。