▲图源谷歌DeepMind(下同)
据悉,FunSearch模型训练法主要为AI模型引入了一个“评估器(e
valuator)”系统,AI模型输出一系列“创意解题方法”,“评估器”则负责评判模型输出的解题办法,反复迭代后,就能训练出数学能力更强的AI模型。
谷歌DeepMind使用PaLM 2模型进行测试,研究人员建立了专用“代码池”,使用代码形式为模型输入一系列问题,并设置了评估器流程,之后模型便会在每一次迭代中,自动从代码池中挑选问题,生成“具有创造性的新解法”,并交由评估器进行评估,其中“最佳解法”将会被重新加入到代码池中,重新开始另一次迭代。
IT之家注意到,FunSearch训练法对“离散数学(Combinatorics)”特别擅长,经训练法锻炼后的模型,可以轻松解决极值组合数学问题,研究人员在新闻稿中便介绍了模型计算“上限级问题(数学中涉及计数和排列领域的一个中心问题)”的过程方法。
此外,研究人员也成功使用FunSearch训练法解决了“装箱问题(Bin Packing Problem)”,这是一个“将不同大小物品放进最少数量容器”的问题,FunSearch为“装箱问题”提供了一种“即时性”的解决方案,生成一项“根据物品现有体积自动进行调整”的程序。
研究人员提到,与其他利用神经网络进行学习的AI训练法相比,经过FunSearch训练法锻炼后的模型,输出的代码更易于检查与部署,也就代表更容易被整合到实际工业环境中。