让
机器人去做同样的事,你会得到一个空洞的眼神或者发现物体被冰冷的机器捏成一团。机器人擅长做高强度的重复性工作,但他们在学习操控新物体方面仍然有待提高。所以一家名为Embodied Intelligence的公司应运而生,它把机器人和人类的力量融合到一个新的系统中,使得研究人员可以更轻松地给机器人传授新任务。它就像是一个虚拟现实游戏,只是你需要控制一个巨大的机器人。
如果你想教机器人去做一些像拿起扳手之类的事,方法有很多。第一个就是对它拿起东西所需要的所有动作进行简单粗暴的编程。一行接一行地敲代码。这种方法非常沉闷和辛苦。
(L-R)Embodied Intelligence创始团队:Peter Chen(首席执行官),Pieter
abbeel(总裁兼首席科学家),Rocky Duan(首席技术官),张天浩(研究科学家)。
强化学习是一项更新、更复杂的技术。加州大学伯克利分校的实验室和Embodied Intelligence一起对一个名叫Brett的机器人进行了研究,这个机器人可以通过推测,自己将方块放在方孔里。当它每做出一个让方块接近洞口的随机动作时,人工智能就会收到奖励。几次尝试之后,机器人越来越接近目标直到成功,它可以在10分钟之内通过自学掌握一个儿童游戏。
所以简单粗暴的编程是不灵活的,而从头开始进行强化学习又非常耗时。毕竟机器人只是一个受物理世界规律束缚的物理机器,它只能在一定的时间内进行有限的尝试。 (在模拟过程中使用强化学习可以大幅提高速度,因为虚拟的尝试和错误发生地更快。)
模仿学习是一项更精确的技术,一个操作员给机器人演示该如何把方块放入方孔当中。它跟直接操纵机器人一样容易,但是机器人将无法自学新的任务。
Embodied Intelligence想要创造一个将模仿和强化混合起来的学习系统。通过VR头显和控制器,人类可以遥控机器人执行某项任务。它在操作员和机器人之间创建了一个更加自然的动力学连接,为了与人类动作相匹配,机器会学习一些算法来引导机器人的运动。然后强化学习就开始了,机器人会通过反复试验和错误来改善自己的动作,直到它可以比人类做得更好。
“通常情况下,你希望你的机器人是个超人,而不是和人类一样。” Embodied Intelligence的联合创始人兼总裁Pieter Abbeel说。“你希望它们一旦掌握了一项技能,就可以通过自己的反复试验,使得这项技能更快、更准确、更可靠,这个过程不需要人类的持续指导,因为人类的动作速度无法与机器人相媲美。”
想象一下未来的工厂。不再需要辛苦的程序员们为流水线上执行不同的任务的每个机器人编写代码,而是只需在VR中展示动作。机器人起初可能会有些生疏,但随着时间的推移,他们会用人工智能来熟悉自己的动作。随着研究人员对算法的不断改进,机器人可能会承担起一项人类教授的特定任务,并用通过自己的摸索去完成不同的事情。
这个系统仍然处于萌芽阶段。目前它正在开发PR2研究机器人,这个机器人相对来说反应较慢,动作较笨拙。目前来说任何现代机器人都远不如人类灵巧,所以即使它可以很好地学习操作员的动作,也不能复制抓取的细节。但是,如果Embodied intelligence有了自己的方法,那么制造商很快就可以向工厂推出可以效仿人类的机器人,然后让他们进行自我加强。
想象一下多个机器人一起使用这样的系统,可以达到怎样的效果。如果你有100台机器人通过网络相互联系,其中一台学到了一些特别有用的东西,那么它就可以把这些知识传递给同伴。我们正在谈论一个潜在的强大蜂巢思想。机器人甚至不必具有相同的形状和尺寸。研究人员已经想出了如何将知识在不同类型的机器之间转换的方法。
就短时间内来看,这个想法不仅能使机器人变得更加智能,也会使人类教起来更容易。在实验室里编程需要花费大量时间并且需要具有博士学位,大多数人都不具备这两项条件。 Embodied Intelligence的联合创始人兼首席执行官Peter Chen说:“我们意识到的是任何可以使用VR头显的人都能够快速地为机器人传授新技能。这种民主化将使机器人技术真正腾飞起来,传统的机器人技术普及面远不及软件,因为任何有电脑的人都可以修补它。”
这是否会使机器人更容易取代人类工作人员?当然有可能。我们看到越来越多的机器人开始和人类一起工作,接手繁琐而重复的任务,让工人可以去从事那些需要敏锐触觉的独特人类工作。如果我们希望这种关系可以达到更好的效果,就需要让我们的机器人同事快速学习,以免他们成为一种会用扳手打我们的头的负担,而不是一种解脱。