1. 首页 >人工智能 > 正文

一种新的大数据量子方法

导读 从基因作图到太空探索,人类继续生成越来越多的数据集-远远超出人们实际处理,管理或理解的信息。机器学习系统可以帮助研究人员应对不断增

从基因作图到太空探索,人类继续生成越来越多的数据集-远远超出人们实际处理,管理或理解的信息。机器学习系统可以帮助研究人员应对不断增长的信息泛滥。这些分析工具中,某些功能最强大的是基于一个称为拓扑的奇异几何分支,该分支处理的属性即使在某些方向弯曲和拉伸时也保持不变。

这种拓扑系统对于分析复杂网络中的连接特别有用,例如大脑的内部布线,美国电网或Internet的全球互连。但是,即使使用功能最强大的现代超级计算机,此类问题仍然令人生畏且不切实际。现在,麻省理工学院,滑铁卢大学和南加州大学的研究人员已经开发出一种使用量子计算机来简化这些问题的新方法。

该团队在“自然通讯”杂志上描述了他们的理论建议。论文的主要作者,机械工程学教授Nam P. Suh的Seth Lloyd解释说,代数拓扑是新方法的关键。他说,这种方法有助于减少每次有人收集有关真实世界的数据时不可避免发生的失真的影响。

在拓扑描述中,数据的基本特征(它有多少个孔?如何连接不同的部分?)被认为是相同的,无论它们被拉伸,压缩或变形了多少。劳埃德(Lloyd)解释说,正是这些基本拓扑属性“对于试图重建数据应该代表的现实世界中的基本模式很重要。”

他说,分析哪种数据集都没有关系。寻找连接和孔的拓扑方法“不管是实际的物理孔,还是数据表示逻辑参数,并且参数中都存在孔。” 这会发现两种漏洞。”

使用传统的计算机,除了最简单的情况外,这种方法都要求很高。劳埃德说:“拓扑分析代表了获取数据重要特征的一种关键方法,但是它在计算上非常昂贵。” “这是量子力学开始的地方。” 他说,新的基于量子的方法可以成倍地加快这种计算的速度。

劳埃德(Lloyd)提供了一个示例来说明这种潜在的加速效果:如果您有一个包含300个点的数据集,则分析该系统中所有拓扑特征的常规方法将需要“一台具有宇宙大小的计算机”,他说。也就是说,它需要2 300(2到300次幂)处理单元-在宇宙中的所有颗粒的约数。换句话说,问题根本无法以这种方式解决。

他说:“这就是我们的算法开始的地方。” 劳埃德认为,使用量子计算机用新系统解决相同的问题将只需要300个量子位,而这种规模的设备将在未来几年内实现。

他说:“我们的算法表明,您不需要一台大型量子计算机就可以踢出一些严重的拓扑图。”

劳埃德说,在许多重要的大型数据集中,量子拓扑方法可能有用,例如了解大脑中的互连。他说:“通过对脑电图或功能性MRI收集的数据集进行拓扑分析,您可以揭示构成我们思维过程的激发神经元序列的复杂连通性和拓扑结构。”

可以使用相同的方法来分析许多其他类型的信息。劳埃德说:“您可以将其应用于世界经济,社交网络或几乎任何涉及货物或信息远程传输的系统。” 但是经典计算的局限性阻止了这种方法的应用。

他说,尽管这项工作是理论上的,但“实验人员已经与我们联系,尝试使用原型”。“您可以在非常简单的量子计算机上找到简单结构的拓扑。人们正在尝试概念验证实验。”

没有参与这项研究的德国慕尼黑马克斯·普朗克量子光学研究所教授伊格纳西奥·西拉克(Ignacio Cirac)称其为“一个非常原始的想法,我认为它具有巨大的潜力。” 他补充说:“我猜想它必须进一步开发并适应特定的问题。无论如何,我认为这是高质量的研究。”

标签:

免责声明:本文由用户上传,如有侵权请联系删除!