1. 首页 >人工智能 > 正文

通过无模型强化学习在20分钟内学会走路

导读 强化学习(RL)是学习机器人技能的完美方法。然而,现实世界的训练需要很多时间;因此,开发了复杂的模拟系统。最近在arXiv org上发表的一篇论

强化学习(RL)是学习机器人技能的完美方法。然而,现实世界的训练需要很多时间;因此,开发了复杂的模拟系统。

最近在arXiv.org上发表的一篇论文着重于机器人运动的任务。结果表明,通过在任务设置和算法实现中的几个精心设计决策,四足机器人可以在20分钟内学会使用深度RL从头开始​​行走。

研究人员不使用新颖的算法组件或任何其他意想不到的创新,而是仔细实施几个现有算法框架之一,结合深度学习包和仔细的设计决策。

该论文表明,现有组件的仔细组合可以实现在现实世界中直接学习运动技能,而训练时间比之前的工作报告的要短得多。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!