热搜: irobot佳士科技机器人开云电竞官网下载app机器人产业联盟ABB机械手发那科机器人展览码垛机器人

OpenAI 曾秘密测试 GPT-4o,力压群雄登顶聊天机器人竞技场排行榜

日期:2024-05-15 来源:IT之家 评论:0
标签: AI 科技 创新
IT之家5月14日消息,OpenAI员工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天 机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以来的最高分。
“GPT-4o是我们最先进的尖端模型,”Fedus在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”
3b1f8ce9-ffac-4298-933a-47afa81ceaf9
聊天机器人竞技场是一个网站,访客可以同时与两个随机的AI语言模型对话,却不知道哪个是哪个,然后选择提供更好回复的模型。
从今年4月份开始,OpenAI在竞技场测试了多个版本的GPT-4o,该模型最初以“gpt2-chatbot”的名称出现,然后变成了“im-a-good-gpt2-chatbot”,最后是“im-also-a-good-gpt2-chatbot”。
自GPT-4o今日发布以来,多方消息人士透露,该模型以巨大优势登顶了LMSYS的内部排行榜,超越了之前排名最高的模型Claude3Opus和GPT-4Turbo。
lmsys.org的官方账号分享了一张图表,并写道:“‘gpt2-chatbot’系列模型刚刚飙升至榜首,以显著的优势(约50Elo)超越了所有其他模型,它已经成为竞技场中最强大的模型。这是一张内部截图,公开版本的‘gpt-4o’现已进入竞技场,并很快将出现在公开排行榜上!”
截至IT之家发稿时,“im-also-a-good-gpt2-chatbot”的Elo分数为1309,领先于GPT-4-Turbo-2023-04-09的1253分和Claude3Opus的1246分。在三个“gpt2-chatbot”出现并搅局之前,Claude3和GPT-4Turbo一直在排行榜上争夺冠军。
声明:凡开云电子链接 来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与开云客户(www.www.wykobounce.com)联系,本网站将迅速给您回应并做处理。
电话:021-39553798-8007
更多> 相关开云电子链接
0 相关评论

推荐图文
推荐开云电子链接
点击排行
Baidu
map