结合了免疫学知识的机器学习模型
响应于人体变化而产生的相互连接的蜂窝信号的复杂网络,提供了大量有趣而有价值的见解,可为开发更有效的治疗方法提供参考。在外周免疫细胞中,可以使用多种工具(包括细胞谱分析技术)观察并定量这些信号。
在过去的几年中,单细胞分析技术(如多色流式细胞术和质谱分析法)已得到显着改善,并且从理论上讲,它们现在可用于获得表现出许多症状的患者的详细免疫特征。尽管如此,过去研究的样本量有限,而且迄今为止收集的患者数据的高维度性增加了假阳性发现的机会,这反过来又导致了不可靠的免疫特征。
对更大范围的患者进行研究可以提高这些细胞谱技术的有效性,使医学研究人员可以更好地了解与医学状况相关的模式。但是,从许多患者那里收集数据可能既昂贵又耗时。
斯坦福大学医学院的研究人员最近开发了免疫学Elastic-Net(iEN),这是一种机器学习模型,可以根据机械免疫学知识预测细胞反应。在发表于《自然机器智能》上的一篇论文中,他们证明了将这种免疫学知识纳入其模型的预测过程中可以提高其在大小患者数据集上的预测能力。
“我们的方法使我们能够利用以前的研究来提高模型的准确性,而无需招募更多的患者,”负责这项研究的研究人员之一尼玛·阿格霍普(Nima Aghaeepour)以及安东尼·库洛斯(Anthony Culos),马丁·昂斯特(Martin Angst)和布莱斯·高迪利埃(Brice Gaudilliere)告诉TechXplore。“我们方法的主要优势在于它不会限制模型的数据驱动性质。在收集的数据与先验知识不一致的情况下,我们的算法可以减少先验知识的重要性,而专注于原始数据如果那被证明是更强大的解决方案。”
LTP研究概述。可视化在外周免疫细胞中测量并通过离体刺激状态着色的细胞内信号传导反应的相关网络。边代表Bonferroni校正后的多对假设校正后的显着(P <0.05)成对相关性。结节大小代表与反应变量(足月妊娠期间的胎龄)的相关性的重要性。图片来源:Culos等。
在医学研究人员必须考虑广泛范围的情况下,各种功能对于做出预测可能同样有价值。因此,Aghaeepour和他的同事开发的机器学习算法不是丢弃与先前的免疫学数据不一致的变量,而是选择了发现具有强烈预测价值和相关性的所有免疫特征。
到目前为止,研究人员已经在三项独立研究中评估了他们的机器学习算法的性能。在所有这些研究中,他们发现他们的模型可以根据从患者血液中产生的模拟数据和大量细胞数据来预测临床相关结果。
Aghaeepour说:“在我们的论文中,我们包含了两个现实世界中的临床案例,其中iEN管道提高了我们对妊娠和牙周疾病建模的准确性。” “我们还有其他激动人心的用例,我们迫不及待要发表,包括手术康复,阿尔茨海默氏病和帕金森氏病。”
将来,Aghaeepour及其同事开发的机器学习平台可以帮助研究多种疾病,医疗状况和神经系统疾病。研究人员使用的数据和iEN算法可在线获得,因此世界各地的其他研究团队可以很快访问和使用它们。
Aghaeepour说:“我们现在也在努力开发适用于其他类型的生物数据集的算法版本。” “一个主要的例子是多组学研究,其中几种组学技术同时用于免疫系统分析。我们相信这些数据集为将先验知识编码到机器学习算法中提供了独特的机会。”