谣言致死?这家印度创业公司想用AI手段杀死假

谣言致死?这家印度创业公司想用AI手段杀死假

时间:2020-01-10 11:01 作者:admin 点击:
阅读模式

本文看点

▪网络虚假信息、错误信息的广泛传播造成了严重后果,甚至会夺走人的性命。在印度,即时通讯软件WhatsApp成为网络谣言滋生、传播的温床。

▪ 初创公司MetaFact使用基于自然语言处理(NLP)的工具,希望借助人工智能实时监控假新闻。通过大量的语言数据集,该技术旨在教会电脑从大量信息中筛选出虚假信息。

▪ 然而,印度各地语言众多,数据集不够,训练机器学习非常难,一些人对人工智能持怀疑态度。还有一些专家认为,要将人工智能与法律措施结合起来,应对虚假信息在互联网的传播。

图注:男子被怀疑绑架小孩,继而被当地村民群殴致死。家人悲痛万分。

原文来自Fast Company,作者Puja Changoiwala

2018年7月,在印度西部马哈拉施特拉邦的一个村庄,五名男子给了一个小女孩一块饼干,却没有意料到,这个举动会让他们付出生命的代价。

在印度全国,Facebook旗下通讯软件WhatsApp上有关绑架的传言甚嚣尘上。因此,当村民们看到陌生男人和孩子说话时,他们以为这些男人图谋不轨。

五名男子受到问话、质询,然后被拖到半英里外的临近村庄,死于棍棒、石头、砖块和鞋子之下。

当地助理警司拉朱·N·布贾巴尔称,当警察到达时,超过3,000人正包围着这五名男子,不让警察帮助受害者。

布贾巴尔说:“在警力不够的情况下,控制局面有点不太可能。暴徒非常愤怒,不允许我们带走尸体,他们想在那里将其直接烧毁。”

据布贾巴尔称,这五名男子是流浪者,来自纳特潘提达瓦里戈萨维部落社区。 他们在不同村庄间流浪,靠接受他人救济为生。

由于他们没有固定地址或移动电话,笔者无法联系其家人。

五人因社交媒体谣言死亡,该事件在印度引起了轩然大波。时任马哈拉施特拉邦首席部长的德文德拉·法德纳维斯表达了对杀人案的悲痛之情。

他说,“现代通讯工具是为了分享信息和知识,我们应该谨慎使用。仅仅因为谣言,就有五个人失去了生命,这实在令人痛心。”他还呼吁社交媒体平台更好地监控虚假信息的传播。

像这样因虚假新闻传播导致无辜人士死亡的,在印度并非仅此一起。 据BBC新闻分析,2017年和2018年,社交媒体平台上的虚假信息至少在印度引发了31起谋杀,并有多人受伤。

错误消息、虚假视频、篡改过的照片和暴力内容在全球网络上都很常见,印度也不例外,这些内容的浏览量常常数以百万计,导致了严重犯罪,甚至带来社区和政治动荡。

印度网民超5亿人。 印度政府和 Facebook、Twitter和WhatsApp等社交媒体平台都正在采取措施,以遏制错误信息和虚假信息的蔓延。

MetaFact是当地一家初创公司。 该公司表示,他们已经在一种名为“自然语言处理(下称NLP)”的人工智能(下称AI)中找到了解决方案。这种AI技术结合了语言学和计算机科学, 旨在让计算机学习大量例子,从而理解人类或自然语言的原理。

MetaFact公司表示,其用来核查事实的工具使用NLP来帮助检测、监视和排除虚假消息。

MetaFact的创始人萨加尔·考尔在给笔者的电子邮件中写道,该工具主要应用于新闻社,“ 能够实时检测和监控假新闻,过滤网络上产生的所有无效信息 ”。

该公司由7名核心团队成员成立,其中3人拥有技术背景,3人是记者,还有1名研究人员。“(该团队人员组成是)为了在新闻和技术之间达到有效平衡”。

其他公司也有使用类似NLP的在线事实核查工具,包括英国的AI公司Factmata。

学术界人士也在尝试使用不同形式的AI,从而遏制互联网虚假信息, 包括密歇根大学和杜克大学的记者实验室。

但人们对MetaFact等工具的反应各不相同。“不幸的是,很多年轻的初创公司为了推销自己,会使用各种花哨的关键词,比如‘由AI助力’之类的。”事实核查网站Alt News的创始人普拉提克·什纳说。

詹西·雅各布是事实核查网站Boom的执行主编, 他对AI工具也持怀疑态度。 Boom在印度与Facebook合作对抗假新闻的传播。

虽然没有听说过MetaFact,但他在给笔者的电子邮件中写道, 并非所有的故事都是简单的非黑即白。

“这些故事很多都很微妙,”他写道,“需要编辑介入(来决定)如何评价一篇报道。有时我们会称一个故事是部分真实、部分虚假的或具有误导性。目前,还没有任何先进的工具能够捕捉到这种微妙差别,也不能自动回复。 工具还不能出色地完成记者的工作。 ”

MetaFact事实核查器能够分析语境,如新闻故事、博客和社交媒体帖子。然后根据句子的语气,如疑问句、陈述句等,识别有争议的句子,来标记错误信息和偏见。

接下来,人工记者会收到过滤的内容,以揭露虚假报道和捏造的指控。考尔解释说:“ 我们训练这个工具的主要目的,是让这个工具理解句子语境,而不是用词本身。 ”

但是,为了检测到错误信息和偏见,MetaFact事实检查器必须接受训练,这包括消化大量的书面案例。到目前为止,所有的训练材料都是用英语编写的。

这可能有助于减少互联网虚假信息的泛滥,但在印度,虚假信息不仅依靠英语传播,还有印地语和其他当地的语言,辛哈说。根据Google和KPMG会计师事务所的一份报告,2016年,印度有2.34亿人使用八种印度语言上网,而英语使用者人数为1.75亿。

据估计,印度语言使用者和英语使用者人数的差距还会扩大。 到2021年,印度90%的新网民都会用印度的语言上网。

辛哈说,由于NLP还不支持当地的印度语言,他“并不太支持在印度网络语境中使用NLP”。“这也会限制MetaFact。”他补充道,因为用印度语言创建所需的AI培训数据集“是一项艰巨的任务”。

考尔承认了不同语言数据间的差距。他说: “印度的问题要严重得多,因为这里有许多地方语言,其口语和书写没有现成干净的数据集。 ”

他补充说,政府智库NITI Aayog“正在为八种主要印度语言提供干净的数据集。我们希望开始用这八种语言来训练我们的工具”。

雅各布还指出, “在一种语言中,出于正常意图共享的内容在另一种语言中可能会变成错误新闻。 ” 他补充说,虽然会多种语言的记者能够发现这些翻译错误,但目前的AI工具可能做不到这一点。

假视频和照片是印度最令人担忧的问题,也给MetaFact等事实核查公司带来了额外的挑战。据德里一家非营利智库Center for Media Studies主任瓦赛提称,各种不同形式的媒介,包括纯文字、纯音频和纯视频,会以不同的方式影响假新闻的可靠度和可信度。

什耶姆·桑德是宾州州立大学媒体效应研究实验室的副主任,他最近与瓦赛提共同完成了一项关于印度虚假信息的研究,该研究由WhatsApp资助,将于明年发表。研究结论称, 视频是在印度传播假新闻的最有效方式。

瓦赛提说, 假新闻的形式不同,人们的心态也不同。 “人们更倾向于相信视频,”她说,“视频证明有事情真正发生了,完全不可能是虚假的。”她的研究还证明:“看更多视频的人往往更相信视频的可信度,并与更多的观众分享视频。”

辛哈补充了瓦赛提的发现,他解释说NLP对大段的文字很有效,但是印度错误信息的本质不在于此。

“用NLP的方法在印度行不通,因为文字长度经常不足,尤其是当错误信息以图像或视频传播时,文字长度只有两三行。”

班加罗尔基督大学的社会科学家阿斯塔·巴厘指出, 另一个问题是,与其他国家不同,印度假新闻的主要传播媒介是WhatsApp,而不是Facebook或Twitter。 她曾发文报道印度的假新闻和社交媒体。

“WhatsApp用起来非常方便,” 巴厘说,因此,虚假信息传播速度比在Facebook等平台快,有些印度人认为Facebook用户界面不够友好(巴厘补充说,她的观点仅代表个人意见)。

MetaFact也在与WhatsApp上泛滥的虚假信息斗争。WhatsApp在印度有4亿用户。考尔说: “WhatsApp是打击网络虚假信息最困难的地方之一。 ”

因此,该公司正在建立一个志愿者社区,名叫“Meta修护者(Metafixers)”,用来向MetaFact报告虚假信息。Meta修护者发现,有近90%的假新闻来自WhatsApp,以文字、图像和视频形式传播。

“我们以‘修护者’作为社区名称的最后一部分,因为我们的成员正试图解决问题,”考尔在一封电子邮件中写道。 “通过建立这些社区、让用户参与进来,我们建立了一道屏障,防止虚假信息在社交平台 (如WhatsApp、Telegram等) 阴暗处滋生泛滥。 ”

印度其他著名的社交媒体网站, 如Facebook (拥有近2.7亿印度用户) 和Twitter (3400万印度用户) ,对MetaFact来说相对不那么复杂,因为它们对数据挖掘是开放的,而WhatsApp会加密用户间的信息数据。

“这就是我们的AI工具真正发挥作用的地方,”考尔说。“使用NLP,我们能够快速检测出有误导性、有偏见、标题党的内容。”

辛哈说,虽然总体来说,错误信息对印度构成一个大问题,但最大的威胁是政治宣传。

牛津大学计算机政治宣传项目(Computational Propaganda Project)的研究员萨曼莎·布拉德肖表示, 社交媒体上,大多数政治宣传活动都是围绕政党和选举展开的。 该项目调查了使用电脑在公众生活中传播误导性信息的现象。

布拉德肖在接受电邮采访时写道:“2019年选举期间,各政党与各类参与者合作,包括私营公司、志愿者组织和社交媒体影响者,通过社交媒体塑造公众舆论。”

“他们也使用了WhatsApp、Facebook和Twitter等平台上的数字广告、数据分析和自动化。还有证据表明,印度总理莫迪自己的应用程序(App)NaMo也使用计算机宣传。”

布拉德肖补充说,一部分的问题“与社交媒体平台的商业模式有关,他们优先展示那种能够使人愤怒、恐惧或怀疑的内容, 这种使人高度情绪化的内容让用户沉迷于点击、滚动,以及与平台产生联系感。 ”

巴里说, 以情感为基础的主题,如民族主义和国家建设,在印度的政治宣传中很常见。 即使是暴徒杀人事件也有政治虚假信息的成分。而有些用户缺乏相关知识,更进一步加剧了危机。

巴里指出了印度的数字鸿沟:截至2017年,尽管印度有超过4.68亿智能手机用户,但 仅拥有一部智能手机还不够,人们可能仍然“不懂得如何使用手机进行交流、寻求改变” 。

巴里说,虽然印度有一些信息科技方面的法律,但这些法律并不涉及假新闻。

巴里在研究中指出, 为了遏制虚假信息危机,除了需要社交平台自我监管,还应该伴有其他措施,如“针对假新闻的法律禁令、相关法律实施和宪法补救”。 她补充说:“解决沟通问题不能仅依赖科技。”

然而,布拉德肖说,MetaFact等AI解决方案是解决虚假信息的重要工具。她说,虚假信息在社交媒体上传播的规模之大、速度之快,需要能够自动检测和删除内容的工具来应对。

但是“仅靠技术方案不足以解决问题 ”。 她补充说,“随着时间推移,用户能够学会破坏这些系统,所以这些AI工具必须不断发展,以适应新的虚假信息策略和技术。”

科尔同意这一观点。 他说,自从MetaFact开始研究这个问题以来,他们在错误信息和虚假信息传播上“看到了巨大变化”。 “在该领域每一个新的案例和研究中,我们都看到,(这些虚假信息的)创建和传播方式都发生了巨大变化。”

他说,“对抗虚假信息的一方也在不断更新自己的工具与想法,以打击虚假新闻问题,但虚假信息制造者总能适应这些打击方式,然后很快反击。所以到目前为止,他们(虚假信息的制造方)总是比我们领先一步。”

与此同时,布贾巴尔表示,警方正在尽其所能,阻止虚假内容夺走更多生命。 他说,在5名男子因为给年轻女孩提供饼干而被杀害的案件中,28名男子嫌疑犯被捕。

在这起凶杀案发生一年半后,布贾巴尔表示,警方会对可能造成伤害的WhatsApp信息采取行动。一旦警察发现了谣言,他们就会准备并传播澄清信息、揭穿谣言。他说,监察村里的宣传活动、用扩音器发布通知,也已经成为该地区执法部门的常规工作。

“事件发生的村庄是一个部落地区。人们有手机,但文化水平低,地区发展也很不成熟,”布贾巴尔说, “没有人想到,这样一场十恶不赦的罪行会因为一些信息而发生。 简直是糟糕至极,这起案件展示了社交媒体的一个缺点。”