搜狐首页 科技 生活大爆炸

手机搜狐

SOHU.COM

网络喷子多?维基百科联合谷歌开发AI算法揪出他们

现在这个互联网时代,网友基本是无拘无束地从网上获取知识、信息或者在网络上畅所欲言。但是渐渐地,网络上的喷子变多了,于是互联网上充斥着一些污言碎语、侮辱性言论,甚至还有人身攻击。于是,为了健康无污染的网络环境,维基百科以及谷歌出手了,把那些口不择言的网络喷子揪出来。

最近,来自维基百科和谷歌的IT专家,公布了把AI用于“节制”维基百科用户评论的成果——找出哪些用户在搞人身攻击,还有他们为什么要在网上骂街。

针对该问题,研究人员开发机器学习算法,分析维基百科在2015年收到的的海量评论,准确点说,是6300万条。

起初,十名人类员工对这些评论进行分类,以明确用户评论中都出现了哪些人身攻击语言方式。然后,这些算法使用10万条包含侮辱性言辞的评论以进行训练,以区分评论中的人身攻击。

分析指出,匿名用户最喜欢发布人身攻击,其概率比注册用户高六倍。但发表最多侮辱性言论的,却是一小撮活跃注册用户。维基百科43%的发表言论来自匿名用户。这些人中的绝大部分并不经常发帖,有的就只发过一次,但平均发表脏话概率比注册用户高六倍。

研究人员发现,80%的人身攻击来自于9000多名用户,而这一群体发侮辱性帖子的平均次数少于五次。这也就是说,某一用户评论戳中另一个用户“痛点”的时候,他们便开始再网上忘乎所以地骂街,似乎忘记了他们的言论可以被千万网友看在眼里。

另外,研究人员发现34人竟然贡献了维基百科全部侮辱性言论的近十分之一。这些人就是网络世界里所谓的“骂街党”——那些喜欢上网和人骂战,把人身攻击作为日常宣泄、娱乐活动的人。

这也就意味着,找出那9000多名用户,并将封掉他们的账号,就可以减少评论中的污言碎语,净化网络环境。

现在,维基百科以及谷歌联合开发的新算法做到了。据悉,新的机器学习算法使得维基百科在用户群中找出这些人变得更加容易,然后只需要把这几个人的账户封掉,就能一下子减少论坛上9%的恶意言论。

这项研究成果会以论文形式发表出来,题目为'Ex Machina: Personal Attacks Seen at Scale'(Ex Machina:大规模人身攻击)。该论文将在四月份澳大利亚珀斯举行的的世界互联网大会上展出。

网络上的骂战比比皆是,维基百科只不过是先迈出了第一步,用AI算法自动筛选,删除有毒言论而已。早前,Facebook也启用AI算法,利用人工智能删除Facebook网站上的色情内容以净化网络环境。

未来,其他的网站也会利用AI算法保卫网络的健康运行。

精选