在CLUE网站周一公布的排名中,腾讯的“混元”以86.918的得分名列第一,紧随其后的是阿里巴巴的“通义-AliceMind”,其得分为86.685分。两者的得分都高于人类,后者的分数为86.678分。
中国智能手机制造商OPPO和外卖巨头美团的AI模型分别名列第四和第五。
报道称,阿里巴巴的云计算部门在一篇文章中表示,上述最新结果意味着人工智能模型对中文的理解达到了一个新水平。
中国的大型科技企业一直在努力改进其自然语言处理技术,这些技术被用来支持虚拟语音助手、机器翻译和垃圾邮件检测等功能。
今年早些时候,中国互联网搜索巨头百度称,其AI数字人“度晓晓”写的一篇高考作文被认为水平超过很多考生,尽管它在文中不太妥当地使用了一个网络俚语。
报道称,一些研究人员也指出,大多数AI模型要真正理解语言的复杂性还有很长的路要走。去年,美国奥本大学的科学家和奥多比软件公司的研究部门发现,当句中词语被随机打乱时,许多在某些理解任务上表现胜过人类的人工智能就无法辨别这句话的意思。