将机器学习应用于宇宙的奥秘
伯克利实验室的科学家教机器分析外来亚原子“汤”的模拟计算机可以击败国际象棋冠军,模拟恒星爆炸并预测全球气候。我们甚至在教导他们成为绝对的问题解决者和快速学习者。
现在,能源部劳伦斯·伯克利国家实验室(伯克利实验室)的物理学家及其合作者已经证明,计算机已经准备就绪,可以解决宇宙最大的谜团。研究小组从模拟的高能粒子碰撞中获取了数千张图像,以训练计算机网络来识别重要特征。
研究人员对称为神经网络的强大阵列进行了编程,以充当一种蜂巢状的数字大脑,以分析和解释碰撞后遗留的模拟粒子碎片的图像。在此测试过程中,研究人员发现,神经网络在约18,000张图像的采样中识别重要特征的成功率高达95%。
该研究于1月15日发表在《自然通讯》杂志上。
下一步将是将相同的机器学习过程应用于实际实验数据。
强大的机器学习算法使这些网络可以在处理更多图像时改进其分析。基础技术用于面部识别和其他类型的基于图像的对象识别应用程序。
本研究中使用的图像-与布鲁克海文国家实验室的相对论重离子对撞机和CERN的大型强子对撞机的粒子对撞机核物理实验有关-重现了亚原子粒子“汤”的条件,该状态是一种称为夸克的超热流体状态。胶质等离子体据信在宇宙诞生后仅存在百万分之一秒。伯克利实验室的物理学家在这两个地点都参与了实验。
该小组成员之一,伯克利实验室核科学部门的核物理学家王新年说:“我们正在尝试了解夸克-胶子等离子体的最重要特性。” 其中一些属性的寿命很短,而且规模很小,以至于仍然笼罩在神秘之中。
在实验中,核物理学家使用粒子对撞机将重原子核粉碎在一起,例如被剥离电子的金原子或铅原子。据信,这些碰撞会释放原子核内的粒子,形成一个短暂的,亚原子级的火球,该火球甚至将质子和中子分解成其通常受约束的构造块(夸克和胶子)的自由浮动形式。
研究人员希望,通过了解这种夸克-胶子等离子体形成的精确条件,例如其中填充了多少能量,以及在转变为流体状态时其温度和压力,他们将对物质的组成粒子有新的见解。及其属性,以及宇宙的形成阶段。
但事实证明,对这些特性进行精确的测量(所谓的“状态方程”是指物质在这些碰撞中从一个相变为另一个相时所涉及的)。实验中的初始条件可能会影响结果,因此提取独立于这些条件的状态方程测量结果具有挑战性。
Wang说:“在核物理学界,圣杯是观察这些高能相互作用中的相变,然后根据实验数据确定状态方程。” “这是我们尚未从实验中学到的夸克-胶子等离子体的最重要特性。”
研究人员还寻求关于控制夸克与胶子之间相互作用的基本力的见解,物理学家称之为量子色动力学。
这项最新研究的主要作者,加州大学伯克利分校的伯克利实验室附属博士后研究员庞龙刚说,2016年,他在法兰克福高等研究院担任博士后时,对这种药物的潜力产生了兴趣。人工智能(AI),以帮助解决具有挑战性的科学问题。
他看到一种形式的AI,即深层卷积神经网络,其结构受到动物大脑中图像处理过程的启发,似乎非常适合分析与科学相关的图像。
“这些网络可以识别模式,并评估围棋游戏中棋盘的位置和选定的动作,” Pang说。“我们认为,'如果我们有一些视觉科学数据,也许我们可以从中获得抽象的概念或有价值的物理信息。'”
Wang补充说:“通过这种类型的机器学习,我们正在尝试确定某种模式或模式的相关性,这是状态方程的唯一特征。” 因此,经过训练后,网络可以自行确定图像中与科学家试图解决的问题最相关的部分和相关性(如果存在)。
Pang说,分析所需的数据积累可能需要大量的计算,在某些情况下,仅创建一张图像就需要花费整整一天的时间。当研究人员采用一系列并行工作的GPU时-GPU是最初为增强视频游戏效果而创建的图形处理单元,此后逐渐扩展为多种用途-他们将每个图像的时间减少到大约20分钟。
他们在研究中使用了伯克利实验室国家能源研究科学计算中心(NERSC)的计算资源,其中大部分计算工作都集中在德国GSI和中部师范大学的GPU集群上。
研究人员指出,使用复杂的神经网络的好处是,它们可以识别甚至在最初的实验中都没有寻找到的功能,例如在根本不需要寻找的情况下在大海捞针中寻找针头。他们甚至可以从模糊图像中提取有用的细节。
“即使分辨率较低,您仍然可以获得一些重要信息,”庞说。
已经开始讨论将机器学习工具应用于来自实际重离子碰撞实验的数据,并且模拟结果应有助于训练神经网络来解释实际数据。
除了粒子对撞机实验以外,王说:“在高能粒子物理学中,这将有许多应用。”
来自以下机构的Kai Zhou,Nan Su,Hannah Petersen和Horst Stocker也参与了该研究:法兰克福高等研究院,歌德大学,GSI HelmholtzzentrumfürSchwerionenforschung(GSI)和华中师范大学。这项工作得到了能源部科学办公室,国家科学基金会,亥姆霍兹协会,GSI,SAMSON AG,歌德大学,国家自然科学基金会,主要国家基础研究发展计划的支持。亥姆霍兹国际反质子和离子研究设施中心。
NERSC是能源部科学办公室的用户设施。
标签: 机器学习