量子计算遇到机器学习

机器学习一直都很热门,自不必多言;量子计算能引起这么高的热度,到底是凭什么?一起来看看本文如何解读~

作者 | Dr.Alessandro Crimi
译者 | 苏本如
出品 | CSDN(ID:CSDNnews)

量子计算和机器学习已经成为当今炙手可热的话题。排除一些明显的炒作外,这当中也有一些真正的基础。随着传统计算技术的发展,基于机器学习等领域的图像相关分析已经取得了令人难以置信的成果。另一方面,量子物理学一直是一个令人难解的神秘领域,它引起了数学(以及许多完全不科学的伪科学)发展的突飞猛进。量子计算正在成为克服传统计算的一些局限性的新方法,包括晶体管小型化的物理限制。

在过去的一年里,人们已经将量子计算作为神经网络的层级,或者将其视为朴素贝叶斯分类器。2020 年 3 月,谷歌宣布发布 TensorFlow Quantum,这是一系列将最先进的机器学习与量子计算算法结合在一起的工具。

简而言之,这个工具的思路是将量子计算作为分类系统中的一个步骤,但我们也可能反过来考虑。

量子机器学习分类器的典型设置(图片由作者提供)

另一种方法是由 Q-CTRL 公司创新提出的,Q-CTRL 一家专注于量子计算的公司,位于悉尼和洛杉矶。这种方法已经得到验证,它将重点放在量子计算上,并有效地使用机器学习来抑制量子硬件噪声和缺陷的影响。

大多数量子计算机硬件可以在不到一毫秒的时间内完成计算,但是因为噪音的影响而需要复位,其导致的性能目前还不如低成本的笔记本电脑。这个结果比我们听到的要糟糕得多,在下一节中我会详细解释这一点。

量子退相干(DECOHERENCE)

量子位(也叫量子比特,qu-bits),这个经典二进制位在量子计算机中的量子版本,当它暴露于硬件噪声中时,其中的信息非常容易退化。这个过程被称为量子退相干(decoherence)。这是我们仍处于量子计算初期的原因之一。

下面是我提供的屏幕截图,一个是理想情况下的一个量子位的预期结果,另一个是在硬件噪声影响下的结果。从一个量子位来看,结果似乎没有那么糟糕,但是想象一下执行一项任务所需要的所有量子位,就可以想象被噪声影响的结果有多大(即使和一个树莓派卡式电脑或手机相比)。

从上图(作者截屏)看到的一个量子位的预期结果

受噪声影响的一个量子位的结果(作者截屏)

如何解决量子退相干问题?自 90 年代后期以来,像安德鲁·斯蒂恩(Andrew Steane)和彼得·肖尔(PeterShor)这样的专家已经提出了一些模型,这些模型通过引入某种冗余来补偿它。然而,如果考虑到需要引入大量的量子位(你需要将每个量子比特重复几次),这种方法在我们现有的量子计算机上实际是不可行的。

Q-CTRL 公司的解决方案是创建基于机器学习的固件,该固件可以修复量子退相干,而不需要额外的不可行的硬件。

量子计算硬件是基于光-物质的交互作用(光学硬件)来执行量子逻辑运算的。这些电磁信号的组成实际上是一种算法,可由机器学习工具定义/细化。这个笨重的圆圈应该会减少量子退相干。要真正理解这种方法,需要具备一个典型的机器学习专家所不具备的量子计算方面的知识。我将在下面部分尽力做个介绍。

Q-CTRL 解决方案被称为 BOULDER OPAL,它是一个 Python 包,可以通过在终端机器中键入如下命令来轻松安装:

pip install qctrl

并简单地执行以下的导入命令:

from qctrl import Qctrl

接下来的工作就是如何设置哈密顿算子(Hamiltonian),dephase,control 等等参数了…,这些是另外一个单独的话题(如果你感兴趣,可以从下面给出的的参考资料中学习,或者阅读这个文档)。关键点是要实现控制并降低噪声,可以通过使用 TensorFlow 或其他机器学习工具来获得基于复杂梯度的优化方法,这些将在下面关于强化学习的部分中讨论。

强化学习(REINFORCEMENTLEARNING)

在可以用来控制噪声的优化中,强化学习已经得到了成功的应用。强化学习是机器学习的一个领域,在该领域中,智能代理(agent)会在一个环境中采取行动,以最大化累积奖励。

量子硬件中强化学习的整体视图。图片来源于iStock

通过量子计算中的强化学习,学习者(Learner)可以通过对量子设备本身进行实验来创建一个优化的脉冲。此外,强化学习可以发现和利用我们不知道的新物理机制。然而,这样做的缺点是学习者无法告诉你如何找到解决方案,因此我们无法了解设备中噪声抑制的物理原理。

对于那些习惯于机器学习而非量子计算的人们,我将在量子物理和强化学习使用的术语之间建立一座桥梁:量子计算机被视为是一个机器学习代理(agent)的环境。该代理的任务是实现执行高保真门的目标。agent 能够对环境做出各种动作(在我们的例子中,是将脉冲施加到量子计算机)。

agent 通过使用一组可测量的可观察值和基于与目标的接近程度的奖励来学习,以实现其目标。我们的奖励来自门保真度。经过多次实验,学习算法利用这些信息来提高 agent 的性能。

总结

  • 为了了解环境和状态,agent 向量子计算机部署了一系列脉冲。
  • 然后 agent 获取此状态,并使用此信息来决定下一步要执行的操作。

在实践中,agent 获取状态并使用神经网络来决定对下一段脉冲采取什么行动。我们对脉冲的幅度进行量化,以便 learner 从一组有限的选项中进行选择。

一个完整的门脉冲被称为一个 episode,在 episode 结束时对 agent 的奖励(在强化学习术语中)由状态给出。这使我们能够将误差信号提升到测量噪声之上。

上述强化学习可以在多种学习者中进行,包括深度策略梯度(DPG)、深度确定性策略梯度(DDPG)和 SAC(Soft Actor Critic)算法。所有这些 learner 都有超参数,必须先对其进行调整,然后才能用于真正的实验

实验可以在 IBM 的量子计算机上运行,也可以结合众所周知的量子计算工具(如 QSkit)和机器学习工具(如 SciKit-learn)。

这种基于机器学习的优化量子计算方法已经证明可以减少硬件错误并提高门保真度(如下图):

图片来源:Q-CTRL/悉尼大学(Mavadiaet al. Nature Com. 2017)

参考资料

  • M. Hidary:Quantum computing: an applied approach
  • T.Jaksch、R.Ortner和P.Auer:Near-optimal Regret Bounds forReinforcement Learning
  • Q-CTRL Quantum Firmware

英文标题:Don’t ask what Quantum Computing can do for MachineLearning
作者:Dr.Alessandro Crimi
原文链接:https://towardsdatascience.com/dont-ask-what-quantum-computing-can-do-for-machine-learning-cc44feeb51e8

译者 | 苏本如
出品 | CSDN(ID:CSDNnews)
https://mp.weixin.qq.com/s/0BUQa_fFazxqNrptS6ct-w
转载此文目的在于传递更多信息,版权归原作者所有。

最新文章