麻省理工学院称第三方 Twitter 机器人检测工具“不准确”：数据集过于简单，泛用性较差

日期：2023-06-26 来源：IT之家评论：0

标签： 人工智能科技创新

　　美国麻省理工学院（MIT）的研究团队近日发表论文指出，现有的第三方推特（Twitter） 机器人账户自动检测工具并不准确，因为其数据集过于简单，缺乏泛用性。

　　此前有消息称，机器人账户过多是阻止马斯克收购推特的原因之一。推特当时声称其日活跃用户中有5%是机器人账户，但马斯克表示这个数字要比5%高得多。

　　推特有自己的机器人账户识别系统，但并未公开。因此，对于普通公众而言，第三方工具是较为可行的检测方法。这些第三方工具使用从推特收集的数据集和机器学习模型来检测机器人的可疑迹象，许多工具和模型已被用于研究社交媒体上的机器人活动，相关论文甚至已达数千篇。

▲用于推特机器人检测的公开基准数据集

　　这些论文中的大多数基准数据集都是在不同推文中收集的数据集合，其中许多都是在特定推文（例如包含特定主题标签的推文）中收集的，每条都由人类手动标记为机器人或人类。然而这种经过专门训练的机器人检测模型在该专业领域表现出色，却并没有涵盖全部领域，并且严重依赖于特定数据，而不是机器人和人类之间的根本差异。

　　当这些模型在其他领域的数据集上进行测试时，它们的准确性很差，几乎与随机预测水平相当。同时，在许多数据集上，即使是相对简单的模型也与最先进的机器学习模型（SOTA）准确率相当。

　　换言之，在一个数据集上训练的模型不能推广到其他数据集，现有的机器人检测数据集由于数据收集简单而通用性较低。

　　最后，研究人员警告说，当使用现有的机器人检测数据集时，用户应该仔细考虑可能存在哪些类型的偏差。研究人员认为，一个根本的解决方案是推特等社交媒体本身就应该为研究人员提供丰富、可靠的数据以及高质量的真实标签。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 哈佛大学将自有品牌的生成性人工智能带到课堂上	• NASA 正开发类 HAL 9000 人工智能，可让宇航员
• 前小米9号员工打造！全球首款安卓桌面机器人接	• 磅策医疗-植发机器人临床试验启动会暨人工智能
• AI 公司 Databricks 推出人工智能模型共享机制	• YouTube 测试 Aloud 人工智能配音功能，可将视
• 雄安新区无人农场探索不断深入无人驾驶为夏收	• 易控智驾：矿山无人驾驶领先者
• 无人驾驶汽车可望率先上路	• A股人工智能热点持续扩散多只科技龙头股价创新

恰佩克奖	机器人高峰论坛	机气林	ITES深圳工业展	机器人研究院	API数据	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会