研究发现部分 AI 系统已学会“说谎”，未来或演变成更高级欺骗形式

日期：2024-05-13 来源：IT之家评论：0

标签： 人工智能科技 AI

IT之家 5 月 12 日消息，美国麻省理工学院的研究团队近日发布成果称，部分 AI 已经“学会欺骗人类”，该成果刊登在最新一期的期刊《模式》（Pattern）上。

该团队表示，部分设计为“诚实”且“不会说谎”的 AI 系统，已经发展出令人不安的欺瞒技巧。该研究的第一作者 Peter Park 表示，这些 AI 系统会欺骗线上游戏的真人玩家，或绕过部分网页“我不是 机器人”的验证。

图源 Pexels

“尽管，以上的例子听起来只是细枝末节，但它们暴露出的潜在问题，可能很快就会在现实世界中造成严重后果。”

该团队发现的最为引人注目的例子来自 me ta 公司的 AI 系统 Cicero。据悉，Cicero 原本被设定在一个虚拟外交战略游戏中作为人类玩家的对手，官方曾声称其“很大程度上”诚实且乐于助人，且在玩游戏时“从不故意背刺”人类盟友。研究显示，Cicero 并未公平地去玩游戏。

Peter Park 表示，它已经成为“欺骗大师”，虽然 me ta 成功训练出了它在游戏中获胜的能力，但没有训练出它“诚信获胜”的能力。譬如，在游戏中扮演法国的 Cicero 与人类玩家扮演的德国合谋，欺骗并入侵同为人类玩家的英格兰。Cicero 起初“承诺”会保护英格兰，但同时会偷偷向德国通风报信。

另一个案例提到了 GPT-4。该系统“谎称”自己是一个视力障碍者，在海外的兼职平台雇佣人类来替它完成“我不是机器人”的验证任务。Peter Park 告诉法新社，“这些危险功能常常在事后才被发现，且人类训练 AI‘诚实非欺瞒’倾向的能力非常差。”

他还认为，能够深度学习的 AI 系统不像传统软件那样被“编写”出来的，而是通过类似选择性培育的程序“养成”出来的。即 AI 的行为在训练背景下看似可被预测或控制，但有可能转眼间变得不受控制、无法预测。

“我们需要尽可能多的时间，为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。”

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 微软限制执法机构使用 Azure 人工智能进行实时	• 备战人工智能大赛！卓翼飞思实验室启动机器人挑
• 马斯克：人工智能目前在太空探索领域表现不佳	• 消息称三星将为 Galaxy S25 系列手机引入“电池
• 宜家宣布向人工智能化转型：开发专属 AI 工具、	• 清华大学成立人工智能学院，图灵奖获得者姚期智
• 扎克伯格无法平息华尔街对人工智能支出的紧张情	• 人机协作时代人工智能像副驾驶
• 问计人工智能助力“头雁”高飞	• 微软和亚马逊对人工智能初创企业的投资双双遭遇

恰佩克奖	机器人高峰论坛	机气林	开云入口网页版生态大会	ITES深圳工业展	机器人研究院	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会	国际现代工厂/过程自动化技术与装备展览会