之前的深度学习能力已成功提升了(机器人的)语言、图像识别能力;加州大学伯克利分校的研究者们研发了一种新算法,使机器人通过练习和试错,自己学会完成任务;这两种深度学习技术颇为相似。研究者们说它们这种方式与人类学习方式更为接近。
在这个视频中,我们看到机器人Willow Garage PR2学习怎样玩乐高玩具、学会完成各种不同的简单任务,包括开瓶盖、组装玩具飞机、插入鞋楦等。
当机器人离开工厂,进入更为嘈杂、充满未知数的环境之中,如家庭、办公室时,这些能力对他们至关重要。当然这也是“Rosie”和“杰森”(电影《摩登家庭》人物)一直以来的梦想;要实现这一梦想,机器人首先要学会观察环境、学会适应变化、掌握许多技能;最理想的是:每一种新环境机器人都能适应,不用重写程序。
“重点是,机器人面对一种新事物时,我们不用为它重新编程。”该项目领导者之一,加州大学伯克利分校教授Pieter Abbeel 说,“写入一个程序,告诉机器人怎样学习,机器人使用同一个程序学习完成我们交给它的所有新任务。”
另一个关键是:机器人能阅读分析海量数据。
BRETT,全称叫做“消灭枯燥工作的伯克利机器人”,能通过摄像头记录其周边环境,每次尝试(任务)后给自己的表现打分;尝试某个任务时,它的神经网络(92000个神经元)会判断任务完成与否——神经系统不停地计算、工作,直至机器人找到解决办法。
虽然这一技术与语言认知能力的技术类似,但实现前者的难度更大。
“在一个事先没有预设好的3D环境中行动,(对机器人)是一个全新的挑战,”博士研究生Chelsea Finn说。“没有明确的方向指引、没有案例告知怎样解决问题,没有类似于语言和图像识别程序那样的解决方案。”
BRETT像大多数机器人一样,行动缓慢;但如果给它一点提示(如任务开始、结束阶段的协助),10分钟之内它就能学会完成一项新工作;如果没有任何帮助,它完成任务的时间则会延长到3个小时左右。
研究团队希望未来几年内使机器人的表现更出色。随着计算机程序处理大数据的能力加强,而且数据库容量扩大,(机器人)完成复杂任务指日可待。
“让我们的机器人学会打扫房间、洗熨衣服,我们还有很长的路要走。”Abbeel说。“但初步结果显示,掌握了深度学习能力,对于机器人从零开始到学会完成复杂任务,有革命性的作用。未来5到10年内,我们也许将亲眼见证机器人学习能力的惊人变化。”