AlphaZero能否从围棋和国际象棋飞跃到量子计算？

一项新的研究表明，DeepMind惊人的游戏算法AlphaZero可以帮助释放量子计算的力量和潜力。

自两年多前出现以来，AlphaZero一再证明了其快速学习能力，将自己提升到围棋，国际象棋和将棋（日本象棋）的特级大师级别。传统的游戏引擎，如IBM在1990年代开创性的深蓝和当前的世界计算机国际象棋冠军Stockfish，都依赖于人类玩家手工制作的启发式方法。AlphaZero采取了一种非常不同的方法------只要只有基本规则，它就会在强化学习环境中通过数百万次自我游戏来磨练自己的技能。

但AlphaZero不仅仅是游戏------它的成功表明，单一算法可以学习如何在一系列场景中发现新知识，DeepMind的David Silver在一篇博客文章中写道。这是创建通用系统以追求通用人工智能（AGI）的关键："我们需要它们灵活并适用于新情况。

与DeepMind的愿景相呼应，丹麦奥胡斯大学（AU）的一个研究小组通过将AlphaZero应用于可能用于量子计算机的三个不同控制问题，进一步证明了AlphaZero的广泛适用性。这项研究发表在最近发表在《自然》科学杂志NPJ Quantum Information上的一篇论文中。

量子计算的大部分潜力在于它能够实现经典计算机无法实现的目标------通过同时计算所有可能性来解决优化问题。虽然已经开发了大量算法来优化量子动力学，但一个常见的限制是它们依赖于良好的初始猜测。

AU研究人员认为，AlphaZero经过游戏验证的自学习能力可以使其系统地绕过这一限制。他们决定从头开始实施该算法，并研究它在量子计算机优化问题上的表现，论文合著者和AU教授Jacob Sherson在一封电子邮件中告诉Synced。

该论文的第一作者，博士生Mogens Dalgaard解释说："当我们分析AlphaZero的数据时，我们发现该算法已经学会了利用我们最初没有考虑的问题的潜在对称性。那是一次了不起的经历。

AlphaZero的成功源于传统的蒙特卡洛树搜索（MCTS）和一步式前瞻深度神经网络（DNN）的结合。来自树下远处的展望信息可以提高经过训练的 DNN 的精度，以产生更集中和无启发式的探索。

当应用于量子计算时，与早期方法相比，AlphaZero在良好解决方案集群的质量和数量方面都取得了实质性的改进。"它能够自发地学习解决方案中意想不到的隐藏结构和全局对称性，甚至超越人类启发式，"研究人员解释说。

该团队发现，当他们将AlphaZero的算法与专门的量子优化算法相结合时，该系统取得了最佳结果。"这非常有趣，因为它指向了一个未来，即现成的AI算法不会简单地接管并主导特殊的主导地位。但是领域专家，在这种情况下是我们物理学家，可以解释一般方法的优缺点，并用我们详细的知识和方法增强它们，"谢尔森写道。

谢尔森说，在项目代码开源后的几个小时内，"大型科技公司与量子实验室和国际一流大学联系了我，以建立未来的合作。因此，我们希望我们的工作将很快付诸实践。

论文《量子动力学的全局优化与AlphaZero深度探索》发表在《自然》杂志上。