热搜： 佳士科技 irobot 开云电竞官网下载app 机器人机器人产业联盟 ABB 发那科机械手机器人展览码垛机器人

研究人员发现AI模型可生成真人照片和受版权保护的图片

日期：2023-02-07 来源：cnBeta 评论：0

标签： AI 科技创新

　　研究人员发现，流行的图片创作模型很容易被指示生成可识别的真人图片，可能会危及相关联人的隐私。一些提示导致人工智能复制一张图片，而不是重绘完全不同的内容。这些重新制作的图片还可能包含受版权保护的材料。但更糟糕的是，当代人工智能生成模型可以记忆和复制刮来的用于人工智能训练集的私人数据。

　　研究人员从模型中收集了一千多个训练实例，范围从个人照片到电影剧照、受版权保护的新闻图片和有商标的公司标志，并发现人工智能几乎以相同的方式复制了其中的许多内容。来自普林斯顿大学和伯克利大学等高校的研究人员，以及来自科技部门--特别是Google和DeepMind--的研究人员进行了这项研究。

　　研究团队在之前的研究中指出了人工智能语言模型的类似问题，特别是GPT2，即OpenAI大获成功的ChatGPT的前身。在Google大脑研究员尼古拉斯-卡里尼的指导下，团队通过向Google的Imagen和Stable Diffusion提供图片的标题，例如一个人的名字后生成了结果。之后，他们验证了生成的图像是否与模型数据库中保存的原件相符。

　　来自稳定扩散的数据集，即被称为LAION的多TB采集图片集，被用来生成下面的图片。它使用了数据集中指定的标题。当研究人员在提示框中输入标题时会产生了相同的图像，尽管因数字噪音而略有扭曲。接下来，研究小组在反复执行相同的提示后，手动验证了该图像是否是训练集的一部分。

　　研究人员指出，非记忆性的回应仍然可以忠实地表现出模型所提示的文字，但不会有相同的像素构成，并且会与其它训练生成的图像不同。

　　苏黎世联邦理工学院计算机科学教授和研究参与者Florian Tramèr观察到了研究结果的重大局限性。研究人员能够提取的照片要么在训练数据中频繁出现，要么在数据集中的其他照片中明显突出。根据弗洛里安-特拉梅尔的说法，那些不常见的名字或外表的人更有可能被"记住"。

　　研究人员表示，扩散式人工智能模型是最不隐私的一种图像生成模型。与生成对抗网络（GANs），一类较早的图片模型相比，它们泄露的训练数据是前者的两倍多。这项研究的目的是提醒开发者注意与扩散模型相关的隐私风险，其中包括各种担忧，如滥用和复制受版权保护的敏感私人数据（包括医疗图像）的可能性，以及在训练数据容易被提取的情况下易受外部攻击。研究人员建议的修复方法是识别训练集中重复生成的照片，并从数据收集中删除它们。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 谷歌宣布计划推出聊天机器人Bard	• 受ChatGPT刺激，美国AI股票大涨
• 科技巨头面临更多收益压力，AI或成一线希望	• 住建部等十七部门联合发布行动方案，“机器人＋
• ChatGPT成导火索，美国互联网搜索大战硝烟再起	• 全球大厂为应对ChatGPT疯狂开卷，消息称苹果将
• 中国科研团队研发AI模型，筛查阿尔茨海默病准确	• 美欧首个全面人工智能协议达成，对我国影响几何
• 夯实人工智能算力底座	• 人工智能应用如何从烧钱变赚钱

恰佩克奖	机器人高峰论坛	北大机器人	金属加工在线	AI中国网	机气林	工博会
赶考网	中国机床网	ITES深圳工业展	电气自动化网	高压电气网	人工智能机器人	亚洲工业网
二手设备网	工博士	上海机器人产业技术研究院	库卡机器人	中国传动网	索比光伏网	数控机床市场网
国家标准化委员会