Anthropic周二宣布,它已经发布了Claude 2,这是一个大语言模型,该公司表示,它在几个关键基准上都有改善,包括编码、数学和推理能力,同时产生的有害答案也减少了。
Claude 2在其第二次主要迭代中得到了更广泛的
应用。Anthropic推出了一个新的beta测试网站,供美国和英国的普通用户注册,同时通过API向企业开放新模型,价格与Anthropic之前仍在运营的Claude 1.3模型相同。
在接受《福布斯》采访时,Anthropic的联合创始人兼首席执行官达里奥·阿莫代伊(Dario Amodei)告诉《福布斯》,与上一代相比,新模型与其说是“巨大的飞跃”,不如说是“更大的飞跃”。“这在很大程度上是一个进化过程。”阿莫代伊说。“你必须在某处划定界限,我们觉得这是一个足够大的改进,即使它只是总体进展的一部分。”
在测试中,Claude 2.0在多个方面的表现都超过了它的前身。它在Python编码测试中得分为71.2分,高于之前的56分;它在中学数学测验中将成绩从85.2分提高到了88分;律师考试分数也从73分上升到76.5分。之前的版本已经可以分析多达75,000个单词的提示——这大约是第一部哈利波特的长度——Claude 2.0则可以处理两倍的提示,大约是一部史诗小说的长度,比如马尔克斯的《百年孤独》。(阿莫代伊告诉《福布斯》,Anthropic公司将在晚些时候再扩大提示大小的限制。)
不到两个月前,Anthropic刚刚获得星火资本(Spark Capital)领投的4.5亿美元新融资,据报道,该公司当时的估值超过40亿美元。该公司透露,数千家企业已经在使用Claude的API。Anthropic还与几家大客户合作,建立定制模型,阿莫代伊说这些客户包括Zoom、Notion和人工智能图像生成器Midjourney,但他拒绝提供更多细节。
对于一家在2021年因对商业化存在分歧而从OpenAI中分离出来的初创公司来说,Claude 2.0的推出似乎代表着某种逆转。但阿莫代伊说,以这种方式商业化一直是Anthropic“基本计划”的一部分。我们是否会根据我们在这个领域的发现,在某个方向上做出一些调整?当然会。”他补充道。
阿莫代伊告诉《福布斯》,这种调整的部分原因是Anthropic认为商业用户可以提供更广泛的“安全试验场”来检查该模型的潜在危险。他说,鉴于Claude 2.0的额外改进,该公司决定更广泛地开放Claude 2.0。目前,消费者版是免费的,不过阿莫代伊说公司最终可能会将其变现。“我们认为这是一次实验。”他说。
与之前的Claude模型一样,新版本也是使用“宪法人工智能”进行训练的,这是一种训练模型的框架,人工智能监督可以改善人工智能的结果,而无需人工参与。阿莫代伊说,尽管如此,在Claude2.0中,除了这种方法之外,还使用了一些人为的反馈和监督。因此,Anthropic声称Claude2.0在限制有害产出方面是其前身的两倍。
“几乎可以肯定的是,有人会在这个模式中找到一些新的越矩行为,有人会发现一些糟糕的AI幻觉。你可以对模型说太多的话,模型也可以回答太多的话。”阿莫代伊承认。“这些事情永远不会完美。”
在Anthropic模型发布不到两个月前,阿莫代伊与OpenAI首席执行官山姆·阿尔特曼(Sam Altman)、谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)以及其他300多人一起签署了一封警告“人工智能带来灭绝风险”的信。显然,Anthropic相信,它可以在继续推出新机型的同时,努力缓解这种世界末日的局面。与此形成鲜明对比的是,一些著名的科技领袖呼吁暂时冻结新模型的发布。
但阿莫代伊建议,与其在行业内禁止发布模型,不如在发布重大模型,甚至培训新模型时,要求证明模型通过了某些安全检查。他说:“我们也许应该问,我们如何用模型来衡量问题并制定规则,而不是在一段固定的时间内暂停。”