在现实世界中安全地学习运动技能

导读深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而，有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态

深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而，有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态和动作。因此，Google Research 最近的一篇论文介绍了一种 RL 框架，用于学习腿部运动，同时满足训练期间的安全约束。

该框架由两个政策组成。“安全恢复策略”将机器人从接近不安全的状态中恢复，“学习者策略”执行所需的控制任务。该算法的有效性在三个运动任务上得到证明。对于高效的步态和走秀任务，实现了没有跌倒且无需手动重置的策略。

只用四次跌倒训练了一条两条腿的平衡任务。该论文表明，在现实世界中自主安全地学习腿部运动技能是可能的。

标签：

免责声明：本文由用户上传，如有侵权请联系删除！