今天上午在纽约市举行的Google人工智能活动上展示的新研究提出了让机器人系统有效地编写自己的代码的概念。这个概念旨在为人类开发者省去在新信息出现时不得不进去重新编程的麻烦。
该公司指出,现有的研究和训练有素的模型可以有效地实现这一概念。所有这些工作都可以证明是开发系统的基础,这些系统可以根据现实世界中遇到的对象和场景继续生成自己的代码。今天展示的新作品是代码即政策(CaP)。
Google研究实习生Jacky Liang和机器人研究科学家Andy Zeng在一篇博文中指出:
通过CaP,我们提议使用语言模型,通过提示直接编写机器人代码。我们的实验证明,与直接学习机器人任务和输出自然语言动作相比,输出代码可以更加泛化以及带来任务性能的提高。CaP允许单一系统执行各种复杂多样的机器人任务,而不需要特定的任务训练。
如上所述,该系统还依赖于第三方库和API,以最佳方式生成适合特定场景的代码--以及对语言和表情符号的支持。这些API中可获取的信息是目前现有的限制之一。研究人员指出:"这些限制指出了未来工作的途径,包括扩展视觉语言模型以描述低级别的机器人行为(如轨迹),或将CaPs与探索算法相结合,可以自主地增加控制基元的集合"。
作为今天公告的一部分,Google将发布一个可通过其GitHub网站访问的代码的开源版本,以建立其迄今为止提出的研究:
https://code-as-policies.github.io/