IT之家从报道中获悉,Jones是Google 2017年研究论文《Attention Is All You Need》的第五位作者,该论文介绍了“transformer”深度学习架构,该架构后来成为聊天
机器人ChatGPT和当前由生成式AI驱动的产品开发竞赛的基础。Ha此前曾担任Stability AI的研究主管和Google Brain研究员。
Jones表示,Sakana AI将专注于为基础模型创建新架构。“我们的方法不是构建一个吸收所有数据的巨大模型,而是使用大量较小的模型,每个模型都有自己独特的优势和较小的数据集,并让这些模型相互通信和协作来解决问题。”Ha解释道。
两位联合创始人表示,Sakana这个名字源自日语单词“さかな”(sa-ka-na),意为“鱼”,旨在唤起“一群鱼聚集在一起,通过简单的规则形成一个连贯的实体”的想法。