Quantum support vector machine for big data classification大数据分类的量子支持向量机

十个公式撑起了整篇论文,发表于Physic Review Letters

监督式机器学习是基于已经分类的训练样本对新数据进行分类。在这项工作中,我们展示了支持向量机,一种优化的二进制分类器,可以在量子计算机上实现,其复杂度在向量的大小和训练示例的数量上是对数的。在传统采样算法需要多项式时间的情况下,获得了指数级的加速。这种量子大数据算法的核心是一种非稀疏矩阵幂运算技术,用于有效地对训练数据内积(核)矩阵进行矩阵反演。

结论

在这项工作中,我们已经证明了机器学习中一个重要的分类器,支持向量机,可以在特征大小和训练数据数量的算法复杂度上以量子力学的方式实现,从而提供了量子"大数据"算法的一个例子。支持向量机的最小二乘公式允许使用相位估计和量子矩阵反演算法。当训练数据核矩阵由相对较少的主成分主导时,量子算法的速度最大。我们注意到存在几种启发式抽样算法用于支持向量机,更一般地说,用于寻找低秩矩阵的特征值/向量。信息论论证表明,在没有先验知识的情况下,寻找低秩矩阵近似的经典下界为Ω(M) ,这表明最小二乘支持向量机也有类似的下界。除了加速之外,量子机器学习的另一个及时的好处是数据隐私。量子算法从不要求对每个训练样例的所有特征进行显式的O(mn)表示,而是以量子并行的方式生成必要的数据结构,即内积的核矩阵。一旦生成了核矩阵,训练数据的单个特征就对用户完全隐藏了。综上所述,量子支持向量机是一种重要的机器学习算法的有效实现。它在数据隐私方面也有优势,可以用作更大的量子神经网络的组成部分。这项工作得到了DARPA、NSF、ENI、GoogleNASA量子人工智能实验室和Jeffrey Epstein的支持。

相关推荐
武子康13 小时前
大数据-98 Spark 从 DStream 到 Structured Streaming:Spark 实时计算的演进
大数据·后端·spark
阿里云大数据AI技术13 小时前
2025云栖大会·大数据AI参会攻略请查收!
大数据·人工智能
代码匠心16 小时前
从零开始学Flink:数据源
java·大数据·后端·flink
Lx35218 小时前
复杂MapReduce作业设计:多阶段处理的最佳实践
大数据·hadoop
武子康21 小时前
大数据-100 Spark DStream 转换操作全面总结:map、reduceByKey 到 transform 的实战案例
大数据·后端·spark
expect7g1 天前
Flink KeySelector
大数据·后端·flink
阿里云大数据AI技术2 天前
StarRocks 助力数禾科技构建实时数仓:从数据孤岛到智能决策
大数据
Lx3522 天前
Hadoop数据处理优化:减少Shuffle阶段的性能损耗
大数据·hadoop
武子康2 天前
大数据-99 Spark Streaming 数据源全面总结:原理、应用 文件流、Socket、RDD队列流
大数据·后端·spark
阿里云大数据AI技术3 天前
大数据公有云市场第一,阿里云占比47%!
大数据