热搜： irobot 佳士科技机器人开云电竞官网下载app 机器人产业联盟 ABB 机械手发那科机器人展览码垛机器人

OpenAI 曾秘密测试 GPT-4o，力压群雄登顶聊天机器人竞技场排行榜

日期：2024-05-15 来源：IT之家评论：0

标签： AI 科技创新

IT之家5月14日消息，OpenAI员工WilliamFedus周一在社交平台X证实，近期在LMSYS聊天 机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”，正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露，GPT-4o在测试中登顶了竞技场排行榜，取得了有史以来的最高分。

“GPT-4o是我们最先进的尖端模型，”Fedus在推特上写道，“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

聊天机器人竞技场是一个网站，访客可以同时与两个随机的AI语言模型对话，却不知道哪个是哪个，然后选择提供更好回复的模型。

从今年4月份开始，OpenAI在竞技场测试了多个版本的GPT-4o，该模型最初以“gpt2-chatbot”的名称出现，然后变成了“im-a-good-gpt2-chatbot”，最后是“im-also-a-good-gpt2-chatbot”。

自GPT-4o今日发布以来，多方消息人士透露，该模型以巨大优势登顶了LMSYS的内部排行榜，超越了之前排名最高的模型Claude3Opus和GPT-4Turbo。

lmsys.org的官方账号分享了一张图表，并写道：“‘gpt2-chatbot’系列模型刚刚飙升至榜首，以显著的优势（约50Elo）超越了所有其他模型，它已经成为竞技场中最强大的模型。这是一张内部截图，公开版本的‘gpt-4o’现已进入竞技场，并很快将出现在公开排行榜上！”

截至IT之家发稿时，“im-also-a-good-gpt2-chatbot”的Elo分数为1309，领先于GPT-4-Turbo-2023-04-09的1253分和Claude3Opus的1246分。在三个“gpt2-chatbot”出现并搅局之前，Claude3和GPT-4Turbo一直在排行榜上争夺冠军。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• AI 聊天机器人大战升温：谷歌 Gemini 预告片展	• Anthropic 宣布在欧洲推出 Claude 聊天机器人，
• Anthropic 宣布在欧洲推出 Claude 聊天机器人，	• OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语
• 微软推出 Places 应用，AI 助力团队高效利用办	• 中美将举行人工智能政府间对话首次会议，交流科
• 豪掷 40 亿欧元，微软在法国最大投资官宣落地 A	• 扎克伯格：AI 数据中心 GPU 紧缺正在缓解，电力
• 人工智能会对经济造成全面影响？OpenAI 高管称	• 研究发现部分 AI 系统已学会“说谎”，未来或演

恰佩克奖	机器人高峰论坛	机气林	开云入口网页版生态大会	ITES深圳工业展	机器人研究院	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会	国际现代工厂/过程自动化技术与装备展览会