深度强化学习架构结合了预先学习的技能 可以动态创建新的技能
来自爱丁堡大学和浙江大学的一组研究人员已经开发出一种方法,可以将深度神经网络(DNN)组合在一起,以创建一种具有新型学习能力的新型系统。该小组在《科学机器人》杂志上描述了他们的新架构及其性能。
深度神经网络能够通过反复训练多个示例来学习函数。迄今为止,它们已被广泛用于各种应用中,例如识别人群中的面孔或确定贷款申请人是否信誉良好。在这项新工作中,研究人员将针对不同应用开发的几种DNN组合在一起,以创建一个具有所有DNN组成部分优势的新系统。他们报告说,最终的系统不仅仅是其各个部分的总和,而且还能够学习DNN不能单独工作的新功能。研究人员称其为多专家学习架构(MELA)。
更具体地说,这项工作涉及为不同功能培训多个DNN。例如,有人学会了使机器人小跑。另一个可以绕过障碍物。然后,所有DNN都连接到门控神经网络,该网络会随着时间的流逝学习如何在需要控制其在环境中移动的机器人时需要其特殊技能的其他DNN。这样,最终的系统便能够执行所有组合DNN的所有技能。
但是,这还不是练习的终点,因为MELA了解了更多有关其组成部分及其功能的知识,它学会了通过尝试和错误的方式将它们一起使用,而这是没有教过的。例如,它学会了如何结合跌倒后的起床和处理湿滑的地板,或者学会如何在其中一个电机发生故障时进行处理。研究人员认为,他们的工作标志着机器人技术研究的一个新的里程碑,提供了一种新的范例,当机器人遇到以前从未遇到过的问题时,人们不必干预。
标签: 深度强化学习架构