马克斯·普朗克光科学研究所的马里奥·克莱恩及其同事们训练了一个人工智能模型,以对1994年至2021年期间在arXiv预印本服务器上发表的143000篇论文开展分析。所有论文都涵盖了与人工智能有关的领域。随后,研究人员使用一个自然语言处理工具,通过从论文标题和摘要中剥离关键词和短语,生成了一个包含近65000个关键概念的列表。
这些概念成为一个语义网络的节点,使该人工智能模型能够发现想法和论文之间的联系。这些数据告诉人工智能模型,人工智能研究领域是如何随着时间推移而变化的,学者们是如何建立联系并探索感兴趣的新领域的。随后其他十种人工智能机器学习方法使用该语义网络,试图找出五年内哪些概念没有被学习。
通过对历史数据进行测试,人工智能能够预测哪些未经研究的概念会在五年内出现在至少三篇论文中,准确率超过99.5%。研究人员建议,该方法可用于预测未来热门话题或帮助开发具有人类理解力的人工智能。
英国伦敦经济学院的加布里埃尔·佩雷拉说:“我认为这篇论文在很大程度上反映了目前计算机科学和人工智能领域的思维方式。”