图源Pexels
乔根森团队利用了涵盖丹麦600万人(2008-2020年)教育、就医、诊断、收入和职业等丰富数据集,将其转化为可用于训练大型语言模型的文本。这种模型类似于ChatGPT,ChatGPT通过分析大量文本数据,预测下一个最可能的词,以此推断未来事件发生的可能性。同理,研究人员开发的“Life2vec”模型可以分析个人生命历程中的事件序列,预测接下来最有可能发生的事情。
在实验中,Life2vec模型仅用2008-2016年的数据进行训练,2016-2020年的数据则用于测试。研究人员将35-65岁的人群分为两组,其中一半在2016-2020年间去世,另一半则存活。Life2vec模型预测他们的存亡结果,其准确率比现有AI模型和保险业常用的死亡率统计表高出11%。
IT之家注意到,该模型还可以比专门用于性格测试的AI模型更准确地预测人口子集的性格测试结果。乔根森认为,Life2vec模型已经吸收了足够多的数据,可以
应用于广泛的健康和社会议题,例如预测和早期干预健康问题,或帮助政府缩小贫富差距。然而,他也强调,该模型如果被企业滥用可能会造成危害。
“Life2vec模型不应该被保险公司使用,”乔根森说,“保险的本质在于分担风险,预测谁会遭遇不幸事件或死亡,违背了保险互助的理念。”但他表示,类似的技术已经存在,并可能被拥有大量用户数据的科技巨头用于预测和影响用户行为。
英国精算师协会的马修・爱德华兹表示,保险公司对新的预测方法确实感兴趣,但目前决策主要依靠一种被称为广义线性模型的简单AI技术。
“保险公司几百年来一直通过分析现有数据来预测寿命,”爱德华兹说,“但由于保单可能长达20-30年,我们对新方法的采用非常谨慎,因为任何重大错误都可能造成巨大损失。虽然一切都在变化,但保险业的步伐会放慢,因为没有人想要犯错。”
Life2vec模型的出现凸显了人工智能技术在预测未来方面的强大潜力,但也引发了重要的伦理问题。如何确保这项技术用于改善人们的生活,而非加剧社会不公,是亟需解决的难题。