让人工智能算法展示他们的工作
可以训练人工智能 (AI) 学习机器自行解决问题和难题,而不是使用我们为它们制定的规则。但通常,研究人员不知道机器为自己制定什么规则。冷泉港实验室 (CSHL) 助理教授 Peter Koo 开发了一种新方法,可以对机器学习程序进行测验,以找出它自己学习的规则以及它们是否正确。
冷泉港实验室助理教授 Peter Koo 与研究生 Shushan Toneyan 在他的实验室。Koo 的团队研究称为深度神经网络 (DNN) 的机器学习 AI 如何工作。他开发了一种新方法来研究这些 DNN 如何学习和预测 RNA 序列中某些模式的重要性。
计算机科学家通过向 AI 机器提供一组数据来“训练”它进行预测。机器根据在训练过程中遇到的信息提取一系列规则和操作——一个模型。Koo 说:
“如果你学习数学的一般规则而不是记住方程式,你就会知道如何解出这些方程式。因此,与其只是记住这些方程,我们希望这些模型正在学习解决它,现在我们可以给它任何方程,它会解决它。”
Koo 开发了一种称为深度神经网络 (DNN)的人工智能, 用于寻找 RNA 链中的模式,以增加蛋白质与其结合的能力。Koo 训练了他的 DNN,称为 Residual Bind (RB),使用与蛋白质结合分数匹配的数千个 RNA 序列,RB 变得擅长预测新 RNA 序列的分数。但 Koo 不知道机器是否专注于人类可能期望的一小段 RNA 字母序列(一个基序),或者他们可能不会期望的 RNA 链的其他一些次要特征。
Koo 和他的团队开发了一种称为全局重要性分析的新方法,以测试 RB 生成的规则来进行预测。他向训练有素的网络展示了一组精心设计的合成 RNA 序列,其中包含科学家认为可能会影响 RB 评估的基序和特征的不同组合。
他们发现该网络不仅仅考虑短主题的拼写。它考虑了 RNA 链如何折叠并与自身结合、一个基序与另一个基序的接近程度以及其他特征。
Koo 希望在实验室测试一些关键结果。但是,Koo 的新方法不是测试该实验室中的每一个预测,而是像一个虚拟实验室。研究人员可以通过计算设计和测试数百万个不同的变量,远远超过人类在现实实验室中测试的能力。
“生物学是超级轶事。你可以找到一个序列,你可以找到一个模式,但你不知道“那个模式真的很重要吗?” 你必须做这些介入性实验。在这种情况下,我所有的实验都是通过询问神经网络来完成的。”
标签: