在现实世界中安全地学习运动技能
发布日期:2022-05-10 16:21:57
导读 深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而,有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态
深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而,有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态和动作。因此,Google Research 最近的一篇论文介绍了一种 RL 框架,用于学习腿部运动,同时满足训练期间的安全约束。
该框架由两个政策组成。“安全恢复策略”将机器人从接近不安全的状态中恢复,“学习者策略”执行所需的控制任务。该算法的有效性在三个运动任务上得到证明。对于高效的步态和走秀任务,实现了没有跌倒且无需手动重置的策略。
只用四次跌倒训练了一条两条腿的平衡任务。该论文表明,在现实世界中自主安全地学习腿部运动技能是可能的。
标签: