科学家自动化核心盒图像识别
Skoltech 研究人员已经训练了一个神经网络来有效地识别核心盒图像中的岩石样本。它将分析过程加快了多达 20 倍,并使岩石样本的描述自动化成为可能。开发的算法用于 DeepCore 系统——由 Skoltech 的衍生公司 Digital Petroleum 创建的数字地质勘探服务。该方法的详细信息在Computers & Geosciences上发表的文章中进行了描述。
地质研究的常规任务之一是岩石样品的描述。在许多情况下,提取的岩心堆放在盒子里。科学家在核心研究期间拍摄盒子或柱子的照片。描述是通过填写电子表格或地质期刊手动编译的。标准分析程序涉及在图形编辑器中从盒子照片中手动提取列。这是一个相当耗时的过程。
为了使这一过程自动化,科学家们使用了机器学习方法。然而,由于数据量有限且图像之间的差异很大,传统的计算机视觉算法在这项任务上表现不佳。例如,如果芯柱的颜色或纹理与相邻的或在不同条件下拍摄的芯柱不同。这种差异显着影响机器学习算法的性能,这需要描述所有可能变体的大型数据集。结果,人们不得不花时间重新训练模型。
为了解决这个问题,Skoltech 的科学家们使用了深度卷积神经网络——一种在结构上与动物视觉皮层相似的人工神经网络。为了训练神经网络,科学家们使用了增强功能,添加了核心盒照片的修改副本以增加数据量。“合成”图像是基于修改后的 CutMix 算法创建的。CutMix 算法通过随机切出一张图像并将其插入到另一张图像中,从一对现有图像中创建一个新图像。由于科学家们对识别岩柱特别感兴趣,他们基于岩心图像模板优化了这种方法,仅从岩心所在的区域切割和交换碎片。
“在同一领域拍摄的核心框可能在视觉上非常相似,但岩石可能会有所不同。如果将来自另一个框的岩石虚拟放置在同一个框内,由于颜色相似,网络会混淆核心区域和框边界. 增强有助于网络关注颜色和形状以外的其他特征,例如结构和纹理,”该工作的第一作者、Skoltech 科学家 Evgeny Baraboshkin 解释说。
在他们的研究中,科学家们描述并测试了新方法,并比较了在“原始”上训练并与增强数据混合的算法的效率。事实证明,由于增强,该算法被训练以在大多数新图像中有效且准确地检测岩柱。这种自动化方法将一个芯盒的处理速度提高了 20 倍。此外,该方法可以自动确定每列对应的深度。以前这需要用尺子测量。
“有趣的是,当我们将增强数据添加到通常的数据集中时,神经网络学会了识别列上有铭文的纸片,尽管在原始数据集中它们也被标记为核心。算法在初始标记中检测到错误并在未来避免它,”Evgeny 补充道。
科学家们将开发的方法作为分析阶段之一引入 DeepCore 系统,这是他们为从图像中自动描述核心而创建的软件产品。从图像中提取列后,程序确定层边界和岩石类型。同时,用户仍有维修的可能。如有必要,专家可以添加其他类型的岩石或更改层边界。自 2021 年以来,DeepCore 已用于采掘行业,帮助专家减少日常工作时间并自动化分析。
标签: