1. 首页 >人工智能 > 正文

通过一次大脑扫描可获取更多有关医疗人工智能的信息

导读 麻省理工学院的研究人员设计了一种新颖的方法,可以从用于训练机器学习模型的图像中收集更多信息,包括可以分析医学扫描以帮助诊断和治疗脑

麻省理工学院的研究人员设计了一种新颖的方法,可以从用于训练机器学习模型的图像中收集更多信息,包括可以分析医学扫描以帮助诊断和治疗脑部疾病的图像。

活跃的医学新领域涉及训练深度学习模型,以检测与神经系统疾病和病症(例如阿尔茨海默氏病和多发性硬化症)相关的大脑扫描的结构模式。但是收集训练数据很费力:每次扫描中的所有解剖结构必须分别由神经病学专家单独概述或手工标记。而且,在某些情况下,例如对于儿童罕见的脑部疾病,一开始只能进行几次扫描。

在最近的计算机视觉和模式识别会议上发表的一篇论文中,麻省理工学院的研究人员描述了一种系统,该系统使用单个标记的扫描以及未标记的扫描来自动合成大量不同训练示例的数据集。该数据集可用于更好地训练机器学习模型,以在新的扫描中找到解剖结构-训练数据越多,这些预测就越好。

麻省理工学院的研究人员开发了一种系统,该系统可以从未标记的数据中收集更多的标记训练数据,这可以帮助机器学习模型更好地检测与神经系统疾病相关的大脑扫描中的结构模式。该系统了解未标记扫描的结构和外观变化,并使用该信息将一个标记扫描塑造和塑造为成千上万个新的,不同的标记扫描。图片由研究人员提供

工作的关键是自动为“图像分割”过程生成数据,该过程将图像划分为更有意义且更易于分析的像素区域。为此,该系统使用了卷积神经网络(CNN),这是一种机器学习模型,现已成为图像处理任务的强大动力。该网络分析了来自不同患者和不同设备的许多未标记扫描结果,以“学习”解剖结构,亮度和对比度变化。然后,它将那些学习到的变化的随机组合应用于单个标记的扫描,以合成既现实又准确标记的新扫描。然后,将这些新合成的扫描输入到不同的CNN中,该CNN学习如何分割新图像。

“我们希望这将使您在没有大量训练数据的现实情况下更容易进行图像分割,”第一作者,电气工程与计算机科学系(EECS)的研究生Amy Zhao说,计算机科学与人工智能实验室(CSAIL)。“在我们的方法中,您可以学习模仿未标记扫描的变化,从而智能地合成大型数据集以训练您的网络。”

赵说,人们有兴趣使用该系统来帮助训练马萨诸塞州总医院的预测分析模型,在儿童患者中,只有一两次被标记的扫描可能存在特别罕见的脑部疾病。

加入赵的论文是:EECS和CSAIL的博士后Guha Balakrishnan;EECS教授弗雷多·杜兰德(Fredo Durand)和约翰·古塔格(John Guttag),以及资深作者阿德里安·达尔卡(Adrian Dalca),他也是哈佛医学院放射学的教员。

系统背后的“魔术”

尽管现在已应用于医学成像,但该系统实际上最初是为智能手机应用程序合成训练数据的一种方法,该应用程序可以从流行的可收集纸牌游戏“ Magic:The Gathering”中识别和检索有关纸牌的信息。“ Magic”发行于1990年代初,拥有20,000多张独特的卡片,每隔几个月就会发行更多张,玩家可以用来构建定制的游戏套牌。

狂热的“ Magic”播放器Zhao想要开发一个使用CNN的应用程序,该应用程序可以使用智能手机摄像头为任何一张卡拍照,并自动从在线卡数据库中提取价格和等级等信息。“当我从游戏商店挑选卡片时,我已经厌倦了将所有名字都输入到手机中并查找等级和组合,”赵说。“如果我可以用手机扫描它们并提取信息,那会很棒吗?”

但是她意识到这是一项非常艰巨的计算机视觉培训任务。“您需要在所有不同的光照条件和角度下,所有20,000张卡片的许多照片。没有人会收集那个数据集。”赵说。

取而代之的是,Zhao在约200张卡片的较小数据集上训练了CNN,并为每张卡片制作了10张不同的照片,以学习如何将卡片扭曲到各个位置。它计算了不同的光照,角度和反射(用于将卡片放置在塑料套中的情况),以合成数据集中任何卡片的逼真的变形版本。Zhao说,这是一个激动人心的热情项目:“但是我们意识到这种方法确实非常适合医学图像,因为这种变形非常适合MRI。”

精神扭曲

磁共振图像(MRI)由称为像素的三维像素组成。在对MRI进行分段时,专家会根据包含体素的解剖结构来分离和标记体素区域。由使用的单个大脑和设备的差异导致的扫描多样性给使用机器学习自动执行此过程带来了挑战。

一些现有方法可以使用“数据增强”从标记扫描中合成训练示例,这会将标记的体素扭曲到不同的位置。但是这些方法需要专家手写各种增强准则,并且某些合成扫描看起来并不像真实的人脑,这可能对学习过程有害。

相反,研究人员的系统会自动学习如何合成逼真的扫描。研究人员在对来自真实患者的100次无标签扫描中训练了他们的系统,以计算空间转换 - 扫描之间的解剖对应。这产生了尽可能多的“流场”,这些流场模拟了体素如何从一次扫描移动到另一次扫描。同时,它计算强度变换,该变换捕获由图像对比度,噪声和其他因素引起的外观变化。

在生成新扫描时,系统将随机流场应用于原始标记的扫描,该扫描流围绕体素移动,直到结构上与真实的未标记扫描相匹配。然后,它覆盖了随机强度转换。最后,系统通过遵循体素在流场中的移动方式将标签映射到新结构。最后,合成扫描与真实的,未标记的扫描非常相似,但是具有准确的标记。

为了测试其自动分割的准确性,研究人员使用了Dice分数,该分数以0到1的比例来衡量一种3-D形状在另一种形状上的拟合程度。他们将其系统与传统的分割方法(手动和自动)在30种不同的形状上进行了比较进行100次不间断测试扫描的大脑结构。在所有方法中,大型结构都相当精确。但是研究人员的系统在较小结构上的表现优于所有其他方法,例如海马,按体积计仅占大脑的0.6%。

“这表明我们的方法比其他方法有所改进,特别是当您进入较小的结构时,这对于理解疾病非常重要,” Zhao说。“而且我们做到了,而只需要进行一次手工标记的扫描。”

为了纪念该作品的“魔术”根源,该代码已在Github上公开发布, 并以其中一张游戏卡“ Brainstorm”的名义公开 提供。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!