可视化大批生物数据的新方法
在细胞水平上研究遗传物质,例如单细胞RNA测序,可以为科学家提供工作中生物过程的详细,高分辨率视图。这种详细程度有助于科学家确定组织和器官的健康状况,并更好地了解影响数百万人口的疾病如阿尔茨海默氏病的发展。但是,还会生成大量数据,因此需要一种有效且易于使用的方法来对其进行分析。
现在,来自密苏里大学和俄亥俄州立大学的工程师和科学家团队创建了一种新方法,可以使用称为“机器学习”的计算机方法来分析单细胞RNA测序中的数据。这种方法利用计算机的功能来智能地分析大量数据,并帮助科学家得出更快的结论并进入下一阶段的研究。Nature Communications发表的一篇新论文详细介绍了它们的方法。
MU工程学院教授Dong Xu说:“单细胞遗传图谱技术是当今技术进步的最前沿,因为它可以测量存在的基因数量以及如何从单个生物细胞的水平表达它们。” “至少以这种方式可以分析成千上万个细胞,因此最终会收集到大量数据。目前,从这类数据中得出结论可能是具有挑战性的,因为必须要处理大量数据。筛选通过以找到研究人员正在寻找的东西。因此,我们应用了一种最新的机器学习方法来解决这个问题-图形神经网络。”
在计算机通过机器学习过程智能地分析数据之后,图神经网络将获取结果并创建数据的可视表示形式,以帮助轻松识别模式。该图由点组成(每个点代表一个单元格),并且相似类型的单元格采用颜色编码,以便于识别。徐说,精密医学是如何使用单细胞RNA测序的一个很好的例子。
“利用这些数据,科学家们可以研究癌组织的微环境中细胞之间的相互作用,或者观察T细胞,B细胞和免疫细胞都试图攻击癌细胞,” Xu说。“因此,在一个人拥有强大的免疫系统并且癌症尚未完全发展的情况下,我们可以学习如何在早期阶段杀死癌症,并且由于机器学习,我们可以更快地获得结果,从而使我们能够更快地进行可行的治疗。”
许认为,这是工程师和生物学家如何共同研究生物学问题的一个很好的例子。他希望生物学家可以将此方法用作解决复杂生物学问题(例如可能治疗阿尔茨海默氏病)的新工具。
标签: 大批生物数据