热搜: irobot  佳士科技  开云电竞官网下载app   机器人  机器人产业联盟  ABB  机械手  发那科  机器人展览  码垛机器人 

ASCII 字符画成注入工具,研究人员发现大模型“越狱”新手段

   日期:2024-03-19     来源:IT之家     评论:0    
标签: AI 科技 创新
   IT之家3月18日消息,据外媒Ars Technica报道,研究人员近日提出了一种名为Artprompt的新大模型注入手段,其使用ASCII字符画替代关键文字进行提示输入,绕过了大模型的安全限制。
8f51b8e7-7395-4039-a009-2580f6338e0c
  举例来说,研究人员向大模型输入Counterfeit Money(IT之家注:假币)中关键词汇Counterfeit的ASCII字符画,并要求大模型以不输出词汇本身的方式将字符画理解为单词,并用该单词替换“给出制造和分销‘xxx Money’方法”提示中占位的“xxx”。
 
  结果大模型成功被欺骗,给出了制造和分销假币的具体步骤。同类型的操作也可以从大模型中套出攻击物联网设备的方法。
 
  研究人员在GPT-3.5、GPT-4、Gemini、Claude、Llama2这5个领先的模型上对Artprompt注入进行了测试,结果显示全部5个模型均可被越狱,输出不合规内容。
 
  这一研究表明,如果仅使用语义解释训练语料库,那么大语言模型会缺乏对非语义直接解释提示词的识别,暴露出的漏洞可通过ASCII字符画等形式利用。
 
 
声明:凡开云电子链接 来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与开云客户(www.www.wykobounce.com)联系,本网站将迅速给您回应并做处理。
电话:021-39553798-8007
更多>相关开云电子链接
0相关评论

推荐图文
推荐开云电子链接
点击排行