从基因图谱到太空探索,人类不断产生着越来越大的数据集——远超过了人类可以处理、管理和理解的范畴。
机器学习系统能够帮助研究者处理这些日渐增长的信息洪流。一些最强大的分析工具是建立在一种奇特的几何学分支上的,称为拓扑学。拓扑学研究的是那些即使在弯曲或拉伸的状态下依然保持不变的性质。
这样的拓扑系统在分析复杂网络中的联系时,特别有用,例如大脑内部、美国电力网络或国际互联网中的连接。但是,即使用现代最强大的超级计算机,这种问题还是令人生畏,很难解决。现在,MIT、滑铁卢大学和南加州大学共同开发出一种新的方法,将使用量子计算机来解决上述问题。
这个团队在本周的《Nature Communications》杂志上提出了他们的理论。 该论文的第一作者Seth Lloyd教授解释说,这种新方法的关键在于代数拓扑。每次人们在收集真实世界的数据时,都会出现一些不可避免的扭曲,而这种方法可以帮助减轻这种扭曲带来的影响。
在拓扑描述中,数据最基本的特征(它有多少个洞?不同的部分之间如何相连?)将被看做是一样的,无论它们如何拉扯、压缩或扭曲。Lloyd解释说,在试着重构数据应当表征的真实世界的隐藏模式时,这些基本的拓扑属性通常非常重要。
这与分析数据的类别无关,他说。在寻找联系和孔洞时,无论是真实的物理孔洞,还是数据中显示出来的逻辑漏洞,拓扑学方法都能发挥作用。这些漏洞它都能找出来。
采用传统计算机时,这个方法的要求实在太高了,除了最简单的情况以外。拓扑学分析「表现了一种找出数据重要特征的关键方法,但是它在计算上却很昂贵。这就是可以采用量子机制的地方,」Lloyd说。这种基于量子的新方法,将以指数级加快计算速度。
Lloyd举出了一个例子,来说明潜在的加速:如果你有一个数据集,其中包含着300个点,要分析这个系统的拓扑特征,传统的方法需要「一台宇宙那么大的计算机」。也就是说,它需要2^300个运算器,近似等于宇宙中所有粒子的数量。所以,用这种方法根本行不通。
「这就是我们的算法发挥作用之处,」他说。用一台量子计算机的新系统来解决这个问题,只需要300个量子比特——而Lloyd认为这样的机器在接下来的几年内就有可能变成现实。
他说:「我们的算法展示出,你并不需要一台巨大的量子计算机,就能解决这种严峻的拓扑学问题。」
Lloyd说,量子拓扑的方法还可以用在许多重要的巨大数据集中,例如理解大脑中的连接。「将拓扑分析用在脑电图或功能核磁共振的数据集中,你就能揭示出,我们的思维过程之下,放电神经元的复杂连接和拓扑序列。」
同样的方法还可以用在分析其他很多类型的信息。「你可以将其用在世界经济上,或者社交网络上,还有远程货物运输或信息交换的系统上。」而传统的计算机的限制让它们无法解决这些问题。
目前,这个方法还只停留在理论阶段。Lloyd说,实验家们已经开始联系他们,想尝试一下原型机。「在一台非常简单的量子计算机上,你就能找出简单结构的拓扑结构。人们正在尝试这方面的概念验证实验。」
本文转自d1net(转载)