导读 加州大学伯克利分校的一个机器人专家团队报告称,通过使用模拟到真实的强化学习来训练机器人,可以训练机器人完成相对简单的任务。在他们发...
加州大学伯克利分校的一个机器人专家团队报告称,通过使用模拟到真实的强化学习来训练机器人,可以训练机器人完成相对简单的任务。在他们发表在《科学机器人》杂志上的研究中,该小组训练了一个机器人在陌生的环境中行走,同时它携带不同的负载,并且完全没有翻倒。
在过去的几年里,机器人专家使用了多种技术来训练机器人在不同的环境中高效、快速地移动。但正如这项新研究的研究人员指出的那样,此类机器人并没有太多有用的应用。他们认为,能够以缓慢但高效的方式执行日常任务的机器人会更有用。为此,他们转向了模拟到真实的强化学习。
该技术涉及通过在模拟环境中暴露于数十亿个示例来训练机器人的模拟版本来执行所需的任务。该方法还涉及使用奖励/惩罚系统作为机器人训练的一部分,例如,如果它在尝试实现目标时做得正确,则会获得“1”的奖励。然而,如果它做错了什么,它就会收到“-1”。随着时间的推移,它会在寻求增加奖励数量时提高其性能。
研究小组使用这种方法训练了一个名为 Digit 的机器人,让它在城镇未知区域的人行道上行走,并在遭受大球反复攻击后恢复,克服身体限制,走过可能会遇到危险的材料。使其绊倒、携带背包、将一袋垃圾放入垃圾箱以及使用手提袋携带个人物品。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!