该论文描述了MineDojo如何被训练为玩Minecraft的过程。研究人员向人工智能提供了73万个YouTube Minecraft视频(转录了超过22亿字),从Minecraft Wiki中采集了7000个网页,以及34万个Reddit帖子,其中有超过660万条讨论Minecraft玩法的评论。
利用所有这些数据,MineDojo可以处理诸如"寻找沙漠金字塔"或"用Ghast玩火球"的命令,并执行完成任务的必要步骤。MineDojo通过一个名为MineCLIP的定制转化器模型来实现这一目标,该模型将视频片段与游戏中的特定活动联系起来。
正如NVIDIA的博客文章所说:
虽然研究人员长期以来一直在视频游戏环境中训练自主人工智能代理,如《星际争霸》、《Dota》和围棋,但这些代理通常只擅长少数任务。因此,NVIDIA的研究人员转向世界上最流行的沙盒游戏《Minecraft》,为通用代理开发一个可扩展的训练框架--一个能够成功执行各种开放式任务的代理。
你可能还记得,今年早些时候,另一个人工智能实现了类似的创举,我们在6月时曾报道过。而且这并不是NeurIPS第一次承认NVIDIA发表的研究材料。从NVIDIA接受的研究论文的完整列表--涵盖机器人学、机器学习、模拟、自动驾驶汽车等--可以在这里查看:
https://www.nvidia.com/en-us/events/neurips/?ncid=afm-chs-44270&ranMID=44270&ranEAID=TnL5HPStwNw&ranSiteID=TnL5HPStwNw-snZPPvlDB545RMC8b1MBPQ
如果你想阅读完整的MineDojo论文(PDF格式),你可以在这里找到它:
https://arxiv.org/pdf/2206.08853.pdf