使用拟真强化学习训练机器人在广阔的环境中执行简单的任务 使用新的动态模型捕捉 DNA 折纸折叠 章鱼激发了机器人的新吸力机制 新设备利用汗水能量打造健身追踪器 科学家构建腕足动物的有机磷酸外壳 研究人员揭开了卵细胞中漩涡的神秘面纱 研究人员训练一组人工智能模型来识别大脑中的记忆形成信号 研究人员通过水微滴接触起电实现氢气形成及其调控 研究人员揭示了分枝杆菌基因组中控制压力适应的隐藏特征 研究人员创造纳米膜以提高化学生产中的反应速率 对新兴光源能量损失的新认识 现在可以很好地测量用于微芯片的新型二维材料的热性能 数据驱动的音乐:将气候测量结果转化为音乐 昆虫如何控制翅膀:昆虫飞行的神秘机制 多伦多大学的研究人员发现了一种 DNA 修复机制 蓝藻如何应对铁短缺 使其成为地球上最成功的光合生物 改进的中红外纳米显微镜可以使细菌内部的视野清晰 30 倍 在原子尺度上发现学习和记忆中重要分子的神经元门户 了解气候变暖对苔原碳释放的影响 自旋电子学:室温旋转自旋纹理的新途径 在土壤细菌中发现的新型抗菌剂 山雀有着非凡的记忆力 一项新研究解释了原因 结理论使围绕行星和卫星的管状地图成为可能 钙敏感蛋白如何执行多项任务 研究人员利用机器学习来创建基于织物的触摸传感器 蜜蜂在野外经历多种健康压力 古生物学家发现了可能是已知最大的海洋爬行动物 研究发现水分子的存在并不是形成的主要障碍 新模型发现之前的细胞分裂计算忽略了分子尺度的驱动因素 全球研究揭示空气中微量元素对健康的影响 研究发现健康饮食可降低乳腺癌幸存者患心脏病的风险 人工智能将帕金森病药物设计速度提高十倍 了解难治性抑郁症情绪处理偏差背后的大脑机制 研究揭示 6b 层神经元对皮质活动的强烈影响 用于目标蛋白稳定性分析的新时间分辨紫外光解质谱策略 研究人员在人类肠道中发现了可以作为敏感生物标志物的神秘遗传元件 新研究揭示了精神活性真菌中酶的结构和进化 短而强大的激光脉冲使阿秒成像成为可能 通过电场和电流感应扭矩对磁力进行电气控制 研究人员创建新的人工智能管道来识别分子相互作用 科学家开发出纳米银浸渍丝缝线以对抗手术部位感染 新的标记方法为多种 柔软和脆弱物种的海洋传感器提供生物粘附界面 首次实现量子互联网的关键连接 致命细菌表现出对血液的渴望 研究人员表示动物也应该被纳入全球碳循环模型 发现银河系中最大质量的恒星黑洞 关于双极膜工作原理的新见解可以指导未来的燃料电池设计 科学家观察细菌群落中的机械波 新的苯并呋喃合成方法能够创建复杂的分子 新研究可以实现更多 更高效的亚稳态材料合成
您的位置:首页 >企业新闻 >

使用拟真强化学习训练机器人在广阔的环境中执行简单的任务

导读 加州大学伯克利分校的一个机器人专家团队报告称,通过使用模拟到真实的强化学习来训练机器人,可以训练机器人完成相对简单的任务。在他们发...

加州大学伯克利分校的一个机器人专家团队报告称,通过使用模拟到真实的强化学习来训练机器人,可以训练机器人完成相对简单的任务。在他们发表在《科学机器人》杂志上的研究中,该小组训练了一个机器人在陌生的环境中行走,同时它携带不同的负载,并且完全没有翻倒。

在过去的几年里,机器人专家使用了多种技术来训练机器人在不同的环境中高效、快速地移动。但正如这项新研究的研究人员指出的那样,此类机器人并没有太多有用的应用。他们认为,能够以缓慢但高效的方式执行日常任务的机器人会更有用。为此,他们转向了模拟到真实的强化学习。

该技术涉及通过在模拟环境中暴露于数十亿个示例来训练机器人的模拟版本来执行所需的任务。该方法还涉及使用奖励/惩罚系统作为机器人训练的一部分,例如,如果它在尝试实现目标时做得正确,则会获得“1”的奖励。然而,如果它做错了什么,它就会收到“-1”。随着时间的推移,它会在寻求增加奖励数量时提高其性能。

研究小组使用这种方法训练了一个名为 Digit 的机器人,让它在城镇未知区域的人行道上行走,并在遭受大球反复攻击后恢复,克服身体限制,走过可能会遇到危险的材料。使其绊倒、携带背包、将一袋垃圾放入垃圾箱以及使用手提袋携带个人物品。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!