麻省理工学院称第三方Twitter机器人检测工具“不准确”:数据集过于简
,美国麻省理工学院的研究团队近日发表论文指出,现有的第三方推特(Twitter)机器人账户自动检测工具并不准确,因为其数据集过于简单,缺乏泛用性。
此前有消息称,机器人账户过多是阻止马斯克收购推特的原因之一。推特当时声称其日活跃用户中有 5% 是机器人账户,但马斯克表示这个数字要比 5% 高得多。
推特有自己的机器人账户识别系统,但并未公开。因此,对于普通公众而言,第三方工具是较为可行的检测方法。这些第三方工具使用从推特收集的数据集和机器学习模型来检测机器人的可疑迹象,许多工具和模型已被用于研究社交媒体上的机器人活动,相关论文甚至已达数千篇。
这些论文中的大多数基准数据集都是在不同推文中收集的数据集合,其中许多都是在特定推文中收集的,每条都由人类手动标记为机器人或人类。然而这种经过专门训练的机器人检测模型在该专业领域表现出色,却并没有涵盖全部领域,并且严重依赖于特定数据,而不是机器人和人类之间的根本差异。
当这些模型在其他领域的数据集上进行测试时,它们的准确性很差,几乎与随机预测水平相当。同时,在许多数据集上,即使是相对简单的模型也与最先进的机器学习模型准确率相当。
换言之,在一个数据集上训练的模型不能推广到其他数据集,现有的机器人检测数据集由于数据收集简单而通用性较低。
最后,研究人员警告说,当使用现有的机器人检测数据集时,用户应该仔细考虑可能存在哪些类型的偏差。研究人员认为,一个根本的解决方案是推特等社交媒体本身就应该为研究人员提供丰富、可靠的数据以及高质量的真实标签。
IT之家附上论文地址:点此前往
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
精彩阅读
-
科普海洋 文化先行 【蔚蓝中国】深圳大学海洋文化科普活动圆满举行...
2023年9月1日-11月30日,深圳市南山区科学技术协会主办的【蔚... -
中国恒大发布澄清公告:机构指公司从未盈利的报告并无实际依据...
:12月4日早间,中国恒大集团发布澄清公告指出,公司注意到一家机构发表了一篇关于... -
优质楼宇推介月|上报传悦坊...
新机遇·新未来 “优质楼宇推介月”专题推介活动 上报传悦坊 上报传悦坊是由... -
2023年度中国直播电商行业合规工作座谈会在京召开...
2023年11月28日,在中国商业联合会的指导下,中国商业联合会直播电商工作委员... -
南航近期将新开、复航和加密多条国际及地区航线...
为进一步丰富旅客出行选择,中国南方航空公司(以下简称“南航”)宣布,将于今年12... -
首届链博会数字科技专题论坛:以数字化赋能供应链现代化...
以数字化赋能供应链现代化 “全球产业体系和产业链供应链呈现多元化布局、区域... -
日元涨或跌,韩国人怎么做到“两头通吃”?...
Park是众多韩国散户投资者中的一员,他们押注日元的跌势必须结束。根据韩国央行的... -
河南省直机关“红旗渠杯”书画展在郑州开幕...
11月30日,由河南省委直属机关工委联合省委办公厅、省委宣传部、省直书协、省文联... -
融合智能、协同、全程数字化能力泛微全新低代码平台e-builder在...
低代码作为一种降低开发成本、提高开发效率的工具,其在行业的全面应用,不仅能满足各... -
论文查重系统的原理是什么,万方检测在线解读...
对于高校大学生、学术工作者以及科研工作者来说,查重一定不陌生。论文是衡量学生学习... -
华联康生物:多元化经营模式,撬动私护市场可持续发展...
中研网的数据显示,2022年中国女性私护品市场消费达到617亿,跃升为世界第三大... -
官宣!瑞士国宝级抗衰品牌NIANCE妮瑞斯进军中国...
2023年11月27日,杭州NIANCE妮瑞斯的足迹已遍布全球30多个国家和地区... -
德定安航空在上海设立新工厂法国驻沪总领事:相信法国企业能为中国市场提...
“德定安的业务增长规模足以证明,像德定安航空这样的法国公司能够为中国的市场提供高... -
中国科学院博士团队领衔研发的干眼症药物研发有了新进展...
(央视记者白爱军)由中国科学院博士团队领衔研发的治疗干眼症等眼部用药系列配方,历... -
福达数科建立上海运营中心,提升香料服务效率和市场影响力...
2023年11月28日上午8:18分,广西福达数字科技有限公司正式在上海建立运营...