1. 首页 >人工智能 > 正文

预测未来癌症的强大人工智能工具

为了更早地发现癌症,我们需要预测未来谁会患上癌症。预测风险的复杂性得到了人工智能 (AI) 工具的支持,但人工智能在医学中的采用受到 新患者群体表现不佳 和忽视 少数族裔的限制。

两年前,来自麻省理工学院计算机科学与人工智能实验室 (CSAIL) 和 Jameel Clinic 的一组科学家展示了一种 深度学习系统,可以仅使用患者的乳房 X 光照片来预测癌症风险。该模型显示出显着的前景,甚至提高了包容性:它对和黑人女性同样准确,鉴于黑人女性死于乳腺癌的可能性高出 43%,这一点尤其重要。

但为了将基于图像的风险模型集成到临床护理中并使其广泛可用,研究人员表示,这些模型需要在多家医院进行算法改进和大规模验证,以证明其稳健性。

为此,他们定制了新的“Mirai”算法,以满足风险建模的独特要求。Mirai 对患者未来多个时间点的风险进行联合建模,并且可以选择从年龄或家族史等临床风险因素中受益(如果可用)。该算法还旨在生成在临床环境中的微小差异中保持一致的预测,例如乳房 X 光检查机器的选择。

该团队使用来自马萨诸塞州综合医院 (MGH) 之前工作的 200,000 多个检查的相同数据集训练 Mirai,并在 MGH、瑞典卡罗林斯卡学院和长庚纪念医院的测试集上对其进行了验证。Mirai 现在安装在 MGH,团队的合作者正在积极致力于将模型整合到护理中。

Mirai 在预测癌症风险和识别所有三个数据集中的高风险群体方面比以前的方法更准确。在 MGH 测试集上比较高风险队列时,该团队发现,与当前的临床标准 Tyrer-Cuzick 模型相比,他们的模型识别出的未来癌症诊断率高出近两倍。Mirai 在 MGH 测试集中不同种族、年龄组和乳房密度类别的患者以及 Karolinska 测试集中不同癌症亚型的患者中同样准确。

“改进的乳腺癌风险模型能够实现有针对性的筛查策略,与现有指南相比,可以实现更早发现,筛查危害更小,”CSAIL 博士生、一篇关于 Mirai 的论文的主要作者 Adam Yala 说,该论文将发表在《 科学转化医学》上。“我们的目标是使这些进步成为护理标准的一部分。我们正在与来自北卡罗来纳州 Novant Health、乔治亚州埃默里、以色列 Maccabi、墨西哥 TecSalud、阿波罗和巴西 Barretos 的临床医生合作,以进一步验证不同人群的模型,并研究如何最好地临床实施。”

这个怎么运作

研究人员表示,尽管广泛采用乳腺癌筛查,但这种做法充满争议:更积极的筛查策略旨在最大限度地提高早期检测的益处,而不太频繁的筛查旨在减少误报、焦虑和成本。甚至永远不会发展为乳腺癌。

当前的临床指南使用风险模型来确定应推荐哪些患者进行补充成像和 MRI。一些指南仅使用年龄风险模型来确定女性是否应该接受筛查以及多久进行筛查;其他人结合了与年龄、激素、遗传和乳房密度相关的多种因素来确定进一步的测试。尽管经过了数十年的努力,但临床实践中使用的风险模型的准确性仍然不高。

最近,基于深度学习乳房 X 线照相术的风险模型显示出良好的性能。为了将这项技术应用于临床,该团队确定了他们认为对风险建模至关重要的三项创新:联合建模时间、可选使用非图像风险因素和方法以确保跨临床环境的一致性能。

时间

风险建模的本质是从不同随访次数的患者身上学习,并评估不同时间点的风险:这可以确定他们接受筛查的频率、是否应该进行补充成像,甚至考虑预防性治疗。

虽然可以训练单独的模型来评估每个时间点的风险,但这种方法可能会导致没有意义的风险评估——比如预测患者在两年内患癌症的风险比五年内更高. 为了解决这个问题,该团队设计了他们的模型,通过使用一种称为“附加危险层”的工具,同时预测所有时间点的风险。

附加危险层的工作原理如下:他们的网络预测患者在某个时间点(例如五年)的风险,作为他们在前一个时间点(例如四年)的风险的延伸。在这样做的过程中,他们的模型可以从具有可变跟进量的数据中学习,然后产生自洽的风险评估。

非图像风险因素

虽然这种方法主要侧重于乳房 X 线照片,但该团队还希望使用非图像风险因素,例如年龄和荷尔蒙因素(如果可用)——但在测试时不需要它们。一种方法是将这些因素作为输入添加到带有图像的模型中,但这种设计会阻止大多数没有这种基础设施的医院(例如 Karolinska 和 CGMH)使用该模型。

为了让 Mirai 在不需要风险因素的情况下从风险因素中受益,网络会在训练时预测该信息,如果不存在,它可以使用自己的预测版本。乳房 X 光检查是健康信息的丰富来源,因此可以从其成像中轻松预测许多传统的风险因素,例如年龄和更年期状态。由于这种设计,全球任何诊所都可以使用相同的模型,如果他们有额外的信息,他们可以使用它。

在临床环境中保持一致的性能

要将深度学习风险模型纳入临床指南,模型必须在不同的临床环境中一致地执行,并且其预测不会受到乳房 X 光照片所用机器等细微变化的影响。即使是在一家医院,科学家们发现标准训练在乳房 X 光检查机器改变前后也不能产生一致的预测,因为算法可以学习依赖特定于环境的不同线索。为了 消除模型的偏差,该团队使用了一种 对抗性方案,其中模型专门学习对源临床环境不变的乳房 X 光照片表示,以产生一致的预测。

为了在不同的临床环境中进一步测试这些更新,科学家们在瑞典卡罗琳斯卡和长庚纪念医院的新测试集上评估了 Mirai,发现它获得了一致的性能。该团队还分析了该模型在 MGH 测试集中跨种族、年龄和乳房密度类别以及 Karolinska 数据集上跨癌症亚型的表现,并发现它在所有亚组中的表现相似。

“非裔美国女性在更年轻的时候继续出现乳腺癌,而且通常在晚期,”没有参与这项工作的马萨诸塞州总医院的乳房外科医生 Salewa Oseni 说。“这与该组中较高的三阴性乳腺癌病例相结合,导致乳腺癌死亡率增加。这项研究证明了风险模型的发展,其预测在整个种族中具有显着的准确性。它在临床上使用的机会很高。”

Mirai 的工作原理如下:

1. 乳房 X 光照片图像通过称为“图像编码器”的东西进行处理。

2. 每个图像表示,以及它来自哪个视图,与来自其他视图的其他图像聚合以获得整个乳房 X 光照片的表示。

3. 通过乳房 X 光检查,可以使用 Tyrer-Cuzick 模型(年龄、体重、激素因素)预测患者的传统风险因素。如果不可用,则使用预测值。

4. 有了这些信息,附加危险层可以预测患者在未来五年内每年的风险。

改善未来

尽管当前的模型没有查看患者之前的任何影像学结果,但随着时间的推移影像学的变化包含了大量信息。未来,该团队的目标是创建可以有效利用患者完整成像历史的方法。

以类似的方式,该团队指出,该模型可以通过利用“断层合成”(一种用于筛查无症状癌症患者的 X 射线技术)进一步改进。除了提高准确性之外,还需要进行额外的研究来确定如何将基于图像的风险模型应用于数据有限的不同乳房 X 光检查设备。

“我们知道 MRI 可以比乳房 X 线照相术更早发现癌症,而且早期检测可以改善患者的预后,”Yala 说。“但对于癌症风险较低的患者来说,假阳性的风险可能会超过收益。通过改进的风险模型,我们可以设计更细致的风险筛查指南,为将要患癌症的患者提供更敏感的筛查(如 MRI),以获得更好的结果,同时减少对其余患者的不必要筛查和过度治疗。”

“我们很高兴也很谦虚地提出这个人工智能系统是否适用于非裔美国人的问题,”医学博士、埃默里大学介入放射学和信息学助理教授 Judy Gichoya 说,他没有参与这项工作。“我们正在广泛研究这个问题,以及如何检测故障。”

标签:

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!