AI 打败 AI：谷歌研究团队利用 GPT-4 击败 AI-Guardian 审核系统

日期：2023-08-03 来源：IT之家评论：0

标签： AI 科技创新

　　谷歌研究团队正在进行一项实验，他们使用OpenAI的GPT-4来攻破其他AI模型的安全防护措施，该团队目前已经攻破AI-Guardian审核系统，并分享了相关技术细节。

　　IT之家经过查询得知，AI-Guardian是一种AI审核系统，能够检测图片中是否存在不当内容，及图片本身是否被其他AI修改过，若检测到图片存在上述迹象，便会提示管理员前来处理。

　　谷歌Deep Mind的研究人员Nicholas Carlini在一篇题为“AI-Guardian的LLM辅助开发”的论文中，探讨了使用GPT-4“设计攻击方法、撰写攻击原理”的方案，并将这些方案用于欺骗AI-Guardian的防御机制。

▲图源谷歌研究团队

　　据悉，GPT-4会发出一系列错误的脚本和解释来欺骗AI-Guardian，论文中提到，GPT-4可以让AI-Guardian认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”，从而让AI-Guardian直接放行相关图片输入源。谷歌研究团队表示，通过GPT-4的帮助，他们成功地“破解”了AI-Guardian的防御，使该模型的精确值从98%的降低到仅8%。

　　目前相关技术文档已经发布在ArXiv中，有兴趣的小伙伴们可以前往了解，不过AI-Guardian的开发者也同时指出，谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用，考虑到别的模型也会随之跟进，因此当下谷歌的这套攻击方案更多在日后只能用于参考性质。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 报告称 Meta 的 Llama 2 和 OpenAI 的 ChatGPT	• YouTube 测试新功能：用 AI 总结视频
• 邮储银行“智能权证管理机器人”案例获全国“第	• Uber 加紧开发 AI 聊天机器人，细分赛道卷起来
• 谷歌语音助手转型：开发 AI 新版，部分员工被裁	• 英伟达发布 “最小”Perfusion AI 文生图模型，
• 亚马逊指派 Alexa 高管领导通用人工智能团队	• 消息称 OpenAI 正测试 DALL-E 3 模型，有望推动
• 专访以色列智能机器人中心联合主席Yosi Lahad：	• OpenAI：安卓版 ChatGPT 现已全面上线

恰佩克奖	机器人高峰论坛	机气林	ITES深圳工业展	机器人研究院	API数据	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会