Jais大型语言模型是一种开源的双语模型,基于庞大的阿拉伯语和英语语言数据而训练,可供世界上4亿多讲阿拉伯语的人使用。
此举也是阿联酋试图引领海湾地区生成式人工智能努力的一部分。在发布Jais之前,阿联酋和沙特阿拉伯一直在大量购买人工智能软件所需的高性能英伟达芯片。当前,全球都在争先恐后地购买英伟达芯片,以推动人工智能的发展。
在此之前,阿联酋在阿布扎比马斯达尔城(Masdar City)的国有技术创新研究所(TII)已经开发了一个开源的大型语言模型Falcon,使用了300多颗英伟达芯片。
今年早些时候,Cerebras签署了一项1亿美元的协议,向G42提供9台超级计算机,这是英伟达潜在竞争对手同类合同中最大的合同之一。
G42人工智能
应用研究部门Inception的CEO Andrew Jackson表示:“阿联酋一直是人工智能领域的先驱,这一次我们希望走在前面。我们认为,这是一场全球性竞赛。当前,大多数大语言模型都以英语为主。但不可否认,阿拉伯语是世界上最大的语言之一,为什么不能拥有一个大语言模型呢?”
但是,阿联酋在人工智能领域的雄心也引发了人们的担忧,即这项技术可能被滥用。事实上,当今最先进的大语言模型,包括支持OpenAI的ChatGPT GPT-4,支持Bard聊天
机器人的Google PaLM,以及me
ta的开源模型LLaMA,都具有可能被滥用。