“熟能生巧”这句话通常是用来形容人类的,但对于刚进入陌生环境的机器人来说,这也是一句很棒的格言。
想象一下,一个机器人来到一个仓库。它具备了它所接受的训练技能,比如放置物体,现在它需要从它不熟悉的货架上挑选物品。起初,机器很难做到这一点,因为它需要熟悉新的环境。为了改进,机器人需要了解它需要改进总体任务中的哪些技能,然后专门化(或参数化)该动作。
现场人员可以对机器人进行编程以优化其性能,但麻省理工学院计算机科学与人工智能实验室 (CSAIL) 和人工智能研究所的研究人员已经开发出一种更有效的替代方法。上个月在机器人:科学与系统会议上展示了他们的“估计、推断和定位”(EES) 算法,该算法使这些机器能够自行练习,有可能帮助它们提高在工厂、家庭和医院中执行有用任务的能力。
为了帮助机器人更好地完成诸如扫地之类的活动,EES 采用了视觉系统来定位和跟踪机器的周围环境。然后,该算法会估计机器人执行某个动作(如扫地)的可靠性以及是否值得进行更多练习。EES 会预测如果机器人改进了某项特定技能,机器人完成整个任务的能力会有多好,最后进行练习。随后,视觉系统会在每次尝试后检查该技能是否正确完成。
EES 可以在医院、工厂、家庭或咖啡店等场所派上用场。例如,如果你想让机器人打扫你的客厅,它需要练习扫地等技能。不过,根据 Nishanth Kumar SM '24 及其同事的说法,EES 可以在没有人工干预的情况下帮助机器人提高水平,只需进行几次练习即可。
“在开展这个项目之前,我们想知道这种专业化是否可以在真实机器人的合理数量的样本中实现,”描述这项工作的论文的共同主要作者、电气工程和计算机科学博士生兼 CSAIL 分支机构的库马尔 (Kumar) 说。
“现在,我们有了一种算法,可以让机器人通过数十或数百个数据点在合理的时间内显著提高特定技能,这比标准强化学习算法所需的数千或数百万个样本要好得多。”
标签:
免责声明:本文由用户上传,如有侵权请联系删除!