其中的关键在于:将人工从大部分制造过程中移除,以及模拟器的广泛使用。
“传统上,人们一直在使用的(训练机器人)的过程需要你研究实际的系统并手动设计模型......这个过程是好的,也是成熟的,但它的可扩展性不是很强。”麻省理工学院教授PulkitAgrawal最近在TechFirst的播客上告诉笔者。“但现在,我们正在将人类从特定行为的设计中移除。”
麻省理工学院的迷你猎豹机器人在3小时内自己学会了走路和跑步。
图片来源:JOHNKOETSIER
Agrawal说,用传统方法训练机器人需要大约100天的高强度训练。这是计算机科学家和工程师在设计行为和完成数月的试错学习所需要的时间。
将时间缩短到3个小时意味着要大量使用使用来自英伟达(NVIDIA)和其他合作伙伴的技术模拟器,同时也意味着要改变训练方法,即从告诉机器人该做什么,变成到让它(相对)自由地去犯错。
“如果我要移除一个人类设计师……我需要付出代价。”Agrawal说。“这个代价就是我们要做试错学习,但这需要更多的数据……如果你在现实世界中做这个,代价是非常昂贵的,因为它需要100天的现实世界经验,而且如果机器人摔倒了,那就不太妙。所以,模拟器提供的是一种安全的游乐场,机器人在这里摔倒以后还可以从头来过,而且模拟器的运行速度比现实时间快得多。”
所以,模拟器和可以犯下没有后果的错误的自由就是这其中最要紧的两个因素。
之前的机器人运行控制系统,比如波士顿动力公司(BostonDynamics)的机器人和麻省理工学院的猎豹3(Cheetah3),都是经过人工分析设计的。麻省理工学院表示,这意味着要依靠工程师来分析运动的物理特性,制定抽象概念,并实现控制器的层次结构,从而使机器人保持平衡和运行。在现实世界中,这意味着试错、分析错误、调整软件模型,以及重新尝试……与此同时,你还得尽量避免机器人硬件在每次掉下来的时候都把自己砸成碎片。
所以模拟是可行的,自我学习也是可行的,但还有一个关键步骤,那就是让模拟的技能适应现实世界,毕竟现实世界与模拟环境还是有所不同。(无论你的模拟环境有多好,它都不可能完全等同于现实。)
麻省理工学院表示:“我们开发了一种方法,通过这种方法,机器人的行为可以从模拟经验中得到改善,而且我们的方法还能在现实世界中成功部署这些学到的行为。为什么机器人的运行技能在现实世界中能运行良好,其背后的逻辑就是:在它在这个模拟器中看到的所有环境中,有些环境将教会机器人在现实世界中有用的技能。当在现实世界中操作时,我们的控制器就会实时识别并执行相关技能。”
其结果就是,这款迷你猎豹机器人能以普通人所能达到的速度奔跑:大约每秒4米,或每小时9英里。
这听起来可能不是很快,但对这个特殊的机器人来说,这已经创下了一个记录。毕竟,它只有一英尺高,20磅重。麻省理工学院的研究生GabrielMargolis说,只要扩大尺寸,它的速度就会提高。这也就意味着,即便他们是想打败博尔特,而不仅仅是坐在轮椅上的老奶奶,他们也可以做到。(早在2012年,波士顿动力公司就推出了一款跑得和博尔特一样快的机器人。不过,那个机器人是在跑步机上运动,并且由外部动力驱动的,而且它有一个支持系统。)
但还有另一个令人惊讶的部分:这个机器人没有视力。
“我们所展示的这款机器人的所有行为基本上都是在没有视力的情况下实现的。”Margolis说。“这款机器人的脚上也没有触摸传感器,但它是通过关节的运动来感觉环境。”
在生物学中,这被称为本体感觉或运动感:一种不用看就能知道你的四肢在哪里以及它们在做什么的能力。(多年前,当笔者在早春时节蹚过一条山间小溪时就体会过这种能力。当时我的脚在冰冷的水中失去了知觉,于是不得不把它们推到河床里,以测试在哪里可以找到坚实的立足点。)
这让猎豹机器人能感觉到它所处的是什么表面:无论是雪还是冰,是水泥还是草还是碎石,猎豹都会相应地调整其运动方法和速度。
Margolis说:“我们当然对增加更多的传感器感兴趣,但我们展示的所有这些行为实际上都是在没有传感器的情况下实现的。使用视觉当然有一些优点,但也有很多缺点,其中之一就是模拟的速度会慢很多,所以你可能无法以同样的方式获得如此快速的提升。”
但有一个合理的问题是:为什么要给这款机器人配上腿呢?
毕竟,用轮子来前进反而更快,更有效率,也更容易学习或编程,而且需要的平衡也少得多。这个问题的答案在于,你希望机器人最终能做什么。
“它们可以去到很多轮式机器人不能去到的地方。”Margolis说。“例如我们可以(通过这种技术)让应急车辆进入人们的家中救人;我们还可以用它开展送货服务,把东西送到你的楼梯上,到你的门廊,甚至到你的家里。”
对于那些可能想从麻省理工学院的有腿机器人研究中受益的人来说,好消息是这是免费的。Agrawal说,该代码是开源项目,任何人都可以下载和使用它,复制结果,并在它的基础上进行构建。
“好消息是,我们真的是在一个低成本的平台上进行这项研究,所以即使你自己建造了一个四足机器人,你也可以在它上面部署我们的系统,因为我们的系统不需要任何专门或昂贵的设备。”Agrawal说。“所以,从某些方面来说,我们的研究是非常民主的。”