AlphaGeometry在高中生国际数学奥林匹克竞赛(IMO)中,30道题目中正确回答25道,正确率为83%。
作为对比,人类金牌得主平均能正确回答25.9个问题,而此前AI模型的最好纪录是成功回答10道几何问题。
这一成绩非常接近人类参赛者的金牌标准,Deepmind认为,这凸显了人工智能在数学领域日益增长的能力。
参与该项目的Deepmind研究员Quoc V Le告诉《金融时报》,新系统是向构建人工通用智能(AGI)迈出的关键一步。
AlphaGeometry是一种结合了语言学习和演绎推理的神经符号系统。该系统结合神经语言模型的预测能力与基于规则的演绎引擎,共同寻找解决方案。
语言模型是一种解决方案助手,当符号引擎无法独立找到解决方案时,它就会向符号引擎建议新的方法。
谷歌Deepmind将这种方法比作心理学家丹尼尔-卡尼曼(Daniel Kahneman)所说的"快思慢虑",结合快速模式识别能力与逻辑推理的深思熟虑。
AlphaGeometry通过从形状和线条中随机生成几何图形来创建训练数据。然后,系统会识别并重建这些图表中的所有连接、关系和证明。通过这一过程,AlphaGeometry无需依赖人工演示或指导,就可以学习和理解几何图形。
Deepmind称这种技术为“符号演绎和回溯”(symbolic deduction and traceback),解决了数学中训练数据太少的问题。
完成后的数据集由十亿个随机的、独一无二的几何物体图组成,每个图中的点和线之间的所有关系都是“详尽推导”出来的。