热搜: irobot  机器人  佳士科技  开云电竞官网下载app   机器人产业联盟  ABB  机械手  发那科  机器人展览  码垛机器人 

一键屏蔽恶意 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具

   日期:2024-10-18     来源:IT之家     评论:0    
标签: 人工智能 科技 AI
网络服务商 Cloudflare 推出一系列防 AI 爬虫的工具,包括可查看 AI 爬虫具体活动的 AI Audit 和一键屏蔽所有 AI 爬虫的 Block AI Scrapers and Crawlers。站长们可以部署相关服务,从而防止自己网站的内容被用于训练 AI 的机器人爬虫扒取。
 
IT之家注:爬虫是一种自动化的程序,可以在互联网上搜索和获取信息,目前许多厂商使用相关爬虫扒取各大网站信息用于训练 AI 模型,相关爬虫容易导致被扒网站产生大量异常流量,为此站长需支付高昂的网络带宽费用,同时也容易导致网站上大量原创 / 隐私内容泄露。
 
Cloudflare 推出的相关工具主要利用签名比对、启发式算法、机器学习和行为分析技术来辨别爬虫,用户可以查看 AI 爬虫的各种行为,包括爬虫类型、访问频率和扫描内容,站长还可以按照需要放行“善意的 AI 机器人”抓取信息(此类“善意的 AI 机器人”主要寻找网站的 robots.txt 来获取信息,通常不会对网站本身产生异常流量,也不会将网页所有数据直接用于全盘训练模型)。
 
3737cf7b-bf6e-4d22-a589-44a379664e8b
 
如果不确定如何处理这些 AI 爬虫,站长们也可以使用 Block AI Scrapers and Crawlers 功能,一键屏蔽所有 AI 爬虫。
 
互联网为许多大语言模型(如 OpenAI 的 GPT 模型和谷歌的 Bard)提供了大部分的训练数据,如今许多厂商为了刷自家 AI 模型分数,大肆通过网络爬虫“拿来式”地获取训练数据,从而让本应你情我愿的行为变得“污名化”,各大网络商直接推出此类禁用 AI 爬虫的服务也在意料之中。
 
 
声明:凡开云电子链接 来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与开云客户(www.www.wykobounce.com)联系,本网站将迅速给您回应并做处理。
电话:021-39553798-8007
更多>相关开云电子链接
0相关评论

推荐图文
推荐开云电子链接
点击排行