新方法使用低质量数据可以更好地预测材料性能
能源技术,医疗保健,半导体和食品生产方面的进步都有一个共同点:它们依靠开发具有特殊性质的新材料(原子的新组合)来执行所需的功能。在不太遥远的过去,知道材料具有什么特性的唯一方法是通过执行实验测量或使用非常昂贵的计算。
最近,科学家一直在使用机器学习算法来快速预测原子的某些排列所具有的特性。这种方法的挑战在于,它需要大量高度准确的数据来训练模型,而这种数据通常不存在。
通过将大量的低保真数据与少量的高保真数据相结合,圣地亚哥加州大学材料虚拟实验室的纳米工程师开发了一种新的机器学习方法,可以比现有模型更准确地预测材料的特性。至关重要的是,他们的方法也是第一个预测无序材料性质的方法,这些无序材料的原子位点可能被多个元素占据或处于空位状态。他们在1月14日的《自然计算科学》中详细介绍了其多保真度图网络方法。
加州大学圣地亚哥分校的纳米工程教授Shyue Ping Ong说:“在设计新材料时,您想知道的关键一件事是该材料是否可能稳定,以及它具有什么样的性能。” Diego Jacobs工程学院和该论文的通讯作者。“根本的问题是,即使我们拥有计算性能较差的大型数据库,也很难获得有价值的准确数据(例如实验测量值)。在这里,我们试图同时兼顾两者之间的优势-保真度数据和较小的高保真度数据,以提高模型在高价值预测中的准确性。”
尽管存在其他多保真度方法,但是这些方法无法很好地扩展或仅限于两个数据保真度。它们不像这种新的多保真度图形网络方法那样准确或动态,该方法可以使用无限数量的数据保真度,并且可以非常迅速地扩展。
在本文中,纳米工程师特别关注了材料的带隙(一种用于确定电导率,材料的颜色,太阳能电池效率等的特性)作为概念验证。与传统的单保真度方法相比,他们的多保真度图网络导致实验带隙预测的平均绝对误差降低了22-45%。研究人员还表明,他们的方法还可以准确预测高保真分子能量。
Ong表示:“对于可以应用的属性没有基本限制。” “问题在于我们拥有哪种类型的数据。”
Ong的团队计划在短期内使用这种新方法来开发用于储能,光伏电池和半导体器件的更好材料。
在预测有序材料的属性时,该团队做出了另一个意外发现-在他们使用的图形深度学习模型中,原子属性表示为学习的长度为16的嵌入向量。通过对这些学习的嵌入向量进行插值,研究人员发现它们还能够为无序材料创建预测模型,这些材料的原子位点可能被一个以上的元素占据或有时会空着,这使得使用传统方法难以研究它们。方法。
“虽然大部分计算和机器学习工作都集中在有序材料上,但无序化合物实际上构成了大多数已知材料,” Ong实验室的助理项目科学家,论文的第一作者Chi Chen说。“使用这种方法,多保真度图形网络模型可以以良好的精度重现无序材料的带隙趋势。”
这为更快,更准确地设计新材料以满足关键的社会需求打开了大门。
“我们在这项工作中展示的是,您实际上可以采用一种机器学习算法来预测无序材料的特性。换句话说,现在我们能够在有序和无序材料的整个空间中进行材料发现和预测。只是订购了材料,”王说。“据我们所知,这是第一个。”
标签: 预测材料性能