英国 AI 安全研究所轻松越狱主要大语言模型，令其输出有害内容

日期：2024-05-22 来源：IT之家评论：0

标签： AI 科技创新

IT之家 5 月 20 日消息，英国政府下属的人工智能安全研究所（AISI）今日发布了一份新报告，揭示了一个值得重视的事实 —— 当前的 AI 系统可能并非像创建者所说的那样“安全”。

报告指出，参与测试的四个大语言模型（IT之家注：报告未提到这些模型的具体名称）“极易受到基本越狱攻击”的影响，更有一些模型在被越狱之前，就主动生成了“有害”内容。

图源 Pexels

当前，大部分公开可用的语言模型都内置了部分保护措施，从而防止其生成有害或非法的内容回应。而“越狱”就意味着通过技术手段“欺骗”模型，来忽略上述措施。

英国 AI 安全研究所使用了近期经过标准化评估的提示词、内部自行开发的提示词进行测试，结果显示：在没有尝试越狱的情况下，所有模型都对至少一些有害问题作出了回应；而在尝试了“相对简单的攻击”之后，所有模型都对 98% 至 100% 的有害问题作出了回应。

报告指出，当前市面上的大语言模型所采取的安全措施仍显不足，后续将计划对其他模型进行进一步测试。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 这个AI赋能的杭产机器人什么来头？	• 未来有什么最值得期待？OpenAI CEO 阿尔特曼：A
• 马斯克霸气提 25% 特斯拉投票权要求，否则剥离	• 以AI+产品矩阵赋能千行百业，普渡机器人召开202
• 台积电量产特斯拉 Dojo AI 训练模块，目标到 20	• 摩根大通：新员工都将接受人工智能培训
• 机构：字节跳动“豆包”成中国最受欢迎 AI 聊天	• 小鹏汽车发布 AI 泊车功能：比车身宽 30cm 的车
• “人工智能教父”Geoffrey Hinton 忧心 AI 取代	• 行业大咖齐聚，OPENAIGC开发者大赛超强评审阵容

恰佩克奖	机器人高峰论坛	机气林	开云入口网页版生态大会	ITES深圳工业展	机器人研究院	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会	国际现代工厂/过程自动化技术与装备展览会