近日,谷歌发布新的
机器人模型RoboticsTransformer2(RT-2),搭载了大语言模型的最新进展,且能帮助训练机器人理解扔垃圾等任务。
RT-2是一种“视觉-语言-行动”模型,可以通过在网络上投喂信息和图像,训练机器人执行响应的动作。这使得机器人变得更加聪明,并赋予它们新的理解和解决问题的能力。
例如,如果希望以前的系统能够扔掉垃圾,必须明确地训练它们能够识别垃圾,以及捡起并扔掉垃圾。RT-2则能够从大量的网络数据中转移知识,它已经知道什么是垃圾,并且可以在没有明确训练的情况下识别垃圾。
谷歌宣称,相比以往第一个版本,新的模型让机器人的性能几乎翻倍,准确率从32%提升至62%。