深度学习技术有助于在三个维度上可视化X射线数据
阿贡科学家团队利用人工智能训练计算机,以跟上高级光子源采集的大量 X 射线数据。计算机已经能够快速处理 2个d 图像一段时间。您的手机可以拍摄数码照片并以多种方式处理它们。然而,在三个维度上处理图像并及时处理要困难得多。数学更复杂,即使在超级计算机上处理这些数字也需要时间。
这是美国能源部 ( DOE ) 阿贡国家实验室的一组科学家正在努力克服的挑战。人工智能已成为解决大数据处理问题的通用解决方案。对于谁使用先进光子源(科学家APS),一个 美国能源部 科学办公室的用户设施阿贡,处理 3倍d 的图像,也可能是关键,以更快的速度打开X射线数据转换成可见光,可以理解的形状。在这方面有所突破可能对天文学,电子显微镜和科学依赖于大量的其他领域的影响 3个d 数据。
“为了充分利用升级后的 APS 的 功能,我们必须重新发明数据分析。我们目前的方法不足以跟上。机器学习可以充分利用并超越目前的可能性。” — Mathew Cherukara,阿贡国家实验室
该研究小组,其中包括来自三个阿贡部门科学家已经开发出一种新的计算框架称为 3 d-CDI-NN,并已表明,它可以创建 3个d 从收集到的数据可视化 APS 几百倍的速度比传统方法可. 该团队的研究 发表在美国物理研究所的出版物《应用物理评论》上。
CDI 代表相干衍射成像,这是一种 X 射线技术,涉及从样品反射超亮 X 射线束。然后这些光束将被探测器收集为数据,并且需要一些计算工作才能将这些数据转换为图像。阿贡 X 射线科学部 ( XSD )计算 X 射线科学小组的负责人 Mathew Cherukara 解释说,部分挑战在于探测器只能从光束中捕获一些信息。
但是缺失的数据中包含重要信息,科学家们依靠计算机来填充这些信息。作为Cherukara笔记,而这需要一些时间做 2 d,它需要更长的时间与做 3个d 图像。因此,解决方案是训练人工智能直接从原始数据中识别物体及其发生的微观变化,而无需填写缺失的信息。
为此,该团队从模拟 X 射线数据开始训练神经网络。 框架标题中的 NN,神经网络是一系列算法,可以教会计算机根据接收到的数据预测结果。该论文的第一作者、美国能源部 阿贡科学用户设施办公室纳米材料中心 ( CNM ) 的博士后研究员 Henry Chan领导了这部分工作。
“我们使用计算机模拟来创建不同形状和大小的晶体,并将它们转换成图像和衍射图案供神经网络学习,”Chan 说。“迅速产生许多现实晶体训练的难易程度是模拟的好处。”
这项工作是使用 Argonne系统评估联合实验室的图形处理单元资源完成的 ,该实验室部署了领先的测试平台,以支持对新兴高性能计算平台和功能的研究。
Argonne 材料科学部的物理学家兼小组负责人 Stephan Hruszkewycz 说,一旦网络经过训练,它就可以很快地接近正确答案。然而,仍有改进的空间,因此 3 D-CDI-NN 框架包括一个过程,使网络完成剩下的工作。Hruszkewycz 与西北大学研究生 Saugat Kandel 一起致力于该项目的这一方面,从而减少了耗时的迭代步骤的需要。
“关于相干衍射的材料科学部的忧虑,因为你可以看到在几个纳米的长度尺度材料-约 100,000 比人类的头发的宽度小倍-用X射线穿入的环境中,” Hruszkewycz说。“本文是这些先进的方法的示范,它极大地方便了成像过程。我们想知道一种材料是什么,以及它是如何随时间变化的,这将有助于我们在进行测量时更好地了解它。”
作为最后的步骤, 3 d-CDI-NN的能力来填充丢失的信息,并拿出一个 3 d 可视化物上的金微小颗粒,在束线收集真实X射线数据测试 34 -ID-C 在在 APS。结果是一种计算方法在模拟数据上快了数百倍,在真实APS 数据上几乎快了几百倍 。测试还表明,网络可以用比通常需要的数据更少的数据来重建图像,以补偿检测器未捕获的信息。
Chan 表示,这项研究的下一步是将网络集成到 APS的工作流程中,以便它在获取数据时从数据中学习。他说,如果网络从光束线上的数据中学习,它将不断改进。
对于这个团队,这项研究也有时间因素。正如 Cherukara 所指出的,APS的 大规模升级 正在进行中,一旦项目完成,现在生成的数据量将呈指数级增长。升级后的 APS 将产生 亮度高达500倍的X 射线束 ,并且光束的相干性——光的特性,允许它以编码更多样品信息的方式衍射——将大大增加。
这意味着虽然现在从样本中收集相干衍射成像数据并获得图像需要两到三分钟的时间,但该过程的数据收集部分将很快提高 500 倍。将该数据转换为可用图像的过程也需要比现在快数百倍才能跟上。
“为了充分利用升级后的 APS 的 功能,我们必须重新发明数据分析,”Cherukara 说。“我们目前的方法是不够的跟上。机器学习可以充分利用并超越目前的可能性。”
除了 Chan、Cherukara 和 Hruszkewycz,该论文的作者还包括来自 Argonne 的 Subramanian Sankaranarayanan 和 Ross Harder;SLAC 国家加速器实验室的Youssef Nashed ;和西北大学的 Saugat Kandel。
标签: 可视化X射线数据