近日,新加坡国立大学研究者推出了Goat模型,称该模型“专门用于算术问题”。研究人员表示“在对LLaMA模型进行微调后,Goat在算数上实现了比GPT-4更高的准确度与更出色的性能”。
▲图源Arxiv
研究人员提出了一种新办法,将任务根据算数的可学习型进行分类,然后利用基本算术原理将不可学习的任务分解为一系列可以学习的任务(IT之家注:把复杂的计算过程分点拆解成简单的步骤)后导入AI模型。
这种新方法可以令模型学习答题模式,并将过程泛化为看不见的数据,而非仅仅依靠纯粹的“权重记忆计算”,因此能够有效地提高算数性能,可以在零样本学习中以“近乎完美的精度”为大数加法和减法生成答案。
研究人员在具备24 GB显存的GPU上进行训练,并将最终得到的模型使用BIG-bench算数子任务进行测试,准确率结果较为出众,领先于业内的Bloom、GPT-NeoX、OPT等模型。其中零样本的Goat-7B的准确率甚至一度超过了少样本学习后的PaLM-540模型,在大数计算方面远超GPT-4。