近期,加州大学研究人员和英伟达在共同发表的新论文中提出“NaVILA模型”,NaVILA的核心创新在于,不需要预先的地图,机器人只需“听懂”人类的自然语言指令,结合实时的视觉图像和激光雷达信息,就可以自主导航到指定位置。
想象一下这样的场景:你早上醒来,家中的服务机器人正在等候你的指令。 你轻轻说道,“去厨房,拿瓶水过来。” 不到一分钟,机器人小心翼翼地穿过客厅,绕开沙发、宠物和玩具,稳稳地站在冰箱前,打开冰箱门,取出一瓶矿泉水,然后轻轻送到你手中。 这一幕曾经只出现在科幻电影中,而现在,得益于NaVILA模型的出现,这正在变成现实。 NaVILA不仅摆脱了对地图的依赖,还进一步将导航技术从轮式扩展到了腿式机器人,使得机器人在更多复杂场景中,具备跨越障碍和自适应路径规划的能力。 在论文中,加州大学研究人员使用宇树Go2机器狗和G1开云入口网页版
进行了实测,根据团队统计的实测结论,在家庭、户外和工作区等真实环境中,NaVILA的导航成功率高达88%,在复杂任务中的成功率也达到了75%。
(使用NaVILA实测机器狗和机器人听指令行动) 这项研究给机器人导航范式带来革新,让机器人的路径规划从“地图依赖”走向“实时感知”。