近期一系列的调查与报道显示,脸书、谷歌、推特、YouTube、Tumblr等平台都曾经被有组织地利用来散布虚假新闻,扰乱信息秩序,造成信息污染。新美国最近发布的《数字欺诈:互联网精准宣传背后的技术》报告,对基于互联网的广告和媒体平台,以及它们如何能够传播政治虚假信息进行了更为深入的研究。重点主要放在俄罗斯的代理商角色以及由谷歌、脸书和推特专门开发和运营的广告技术上。虚假信息的传播当然并不限于这三家平台公司,但它们目前处于一个庞大的内容生态系统的中心,能够实现高度针对性的政治沟通,通过精准的定制信息与数百万人进行互动,继而改变选民意见构成,增加将散布性支持(diffuse support)变成为特定支持(specific support)进而改变政治结构的可能性。

就国内情况而言,近期一项基于《网络安全法》对我国500家网站(站长之家排名前500)进行的法律文本、内容文本和技术检测实证分析显示:99%的网站使用第一方cookie搜集个人信息,77%使用第三方;但仅有24%对于cookie的使用在其隐私政策中做公开声明,仅有5%明确指出可能使用第三方cookie。AWVS技术检测的结果显示,70%的敏感信息类网站存在中级以上数据安全漏洞,包括跨站脚本攻击、HTML表单缺乏跨站点伪造请求保护、Slow HTTP Denial of Service Attack、User credentials are sent in clear text、POODLE attack等在内的高危、中危风险。还有大量的如点击劫持(65%)、cookie未设置安全标识(63%)、cookie未设置HttpOnly标识(52%)等低危风险。国内的商业网站具有更高的合规性,但合规程度总体依然偏低(邵国松、薛凡伟、郑一媛、郑悦,2018)。因此该报告对于反观我国互联网安全生态水平也具有反思意义。

报告详细检查了整个互联网精确宣传的“工具箱”,主要包括:1. 行为数据收集;2. 数字广告平台;3. 搜索引擎优化;4. 社交媒体管理软件;5. 算法广告技术。这些技术可以被单独或者组合起来使用,出色的技术机器有助于协调广告商和平台公司的经济利益。广告活动越成功,每个人赚的钱就越多。在市场上,所有广告商本质上都是一样的,无论他们是在推销零售产品、新闻报道、政治候选人,还是在散布虚假信息。当涉及到这些工具的应用时,所有广告商都试图模仿最成功的说服策略。这意味着,所有行为数据收集工具都适用于政治虚假信息的任务,这些工具的目的是将通信定向到反应迅速的受众,即人口统计学上类似的人群中更容易参与和说服的经过预先筛选的部分。

一、行为数据收集

数据使得广告商能够推断出个体的喜好、行为和想法——这些都被用来服务具有高度针对性的数字广告宣传。与任何其他类型的广告商一样,虚假信息的操纵者也会从行为数据的收集中获益。操纵者的目标是尽可能多地收集潜在受众的数据,以便在各种媒体渠道定制多样化的原生内容,并在网络平台有针对性地投放广告。每一篇帖子、每一次点击、每一个搜索、每一次分享,都会被记录到用户的个人资料里,再将用户划分到更加细分的受众群,输入机器学习算法。收集的用户行为数据越多,推送就越能贴合用户独特的兴趣点。

Yelp、麦当劳和Pandora手机应用的位置请求

收集数据可以通过多种方式完成。如果操纵者有一个或多个web网页,则可以通过第一方cookie直接收集数据。虚假信息的操纵者通常会运营新闻网站或博客,网站内容与他们在社交媒体平台上推送的内容相似。与上述内容的互动行为数据,对于后续的信息撰写和对特定人口群体投放广告尤其有价值。操纵者还可以在其他网站上投放携带相关宣传信息的第三方cookies,以扩大收集的范围。他们可以用各种方式从商业供应商那里购买用户行为和位置数据,比如通过数据中介。此外,操纵者可以通过收集电子邮件订阅地址或短信提醒电话号码,将来自第一方cookie的行为数据与个人身份识别信息联系起来。

脸书能够追踪第三方网站上的个人活动,只要这些网站包含脸书的参与功能(比如“Like”按钮),脸书就得以捕获行为数据(包括脸书用户以及非脸书用户相关的数据),并将数据链接到其受众网络(Audience Network)服务中,这一服务使客户可以在脸书应用程序之外以及其他移动应用程序上投放广告。这项服务虽然并没有向广告商提供个人数据,但却将个人数据集成到了脸书的广告服务中。这种方式可以有效划分不同的人口群体,只关注那些对特定信息高度敏感的人,即使他们没有脸书账户。

通过拥有这些数据,虚假信息的操纵者可以清晰地发现现有和潜在的受众。对目标受众了解得越多,就越容易发现、操纵和欺骗他们。

二、在线广告购买

大量收集互联网行为数据有一个最中心的目的:使定向广告投放更有效,推动内容传播、销售、激发情感和有更好的说服效果。过去几年来计算和存储能力的提高,使定向广告的成熟度和精确度也大大提高。利用自动化实验,可以显著提高结合了用户分析而投放的数千条消息的有效性。得益于受众细分群体分析,虚假信息宣传可以用更低的成本来实现两个关键目标:1.找到并培养其核心支持者以外的响应受众;2.使渠道内充斥着宣传内容,形成信息的病毒式传播。

breitbart.com上持续弹出的电子邮件地址订阅请求

受众细分和定向广告工具是数字广告的最重要特征。虚假信息的操纵者可能使用的所有的行为跟踪工具、收集的个人信息、进行的用户分析,很大程度上都是为了提高精准广告的有效性。在社交媒体上发布的原生内容,只会将虚假信息的传播范围扩大到那些关注了虚假信息提供者的用户,或者是看到朋友转发了此类内容的用户。要想接触到具有不同人口特征和偏好的新受众,或以特定信息覆盖整个社交媒体平台的话,就需要将原生内容进一步进行传播。这种策略在虚假信息宣传中越来越常见——最近发布的肯尼亚全国选举前竞选策略报告中,就记录了这种策略。

广告购买会加深与已知受众群体的互动,并扩大受众群体。对于明显达到某种流行程度的内容,广告购买可以通过大型互联网平台的网络效应,使这一内容进一步病毒式传播,触及数千万用户。除了这些好处之外,虚假信息宣传还有着广告平台自身内置的精准投放功能(例如,获取用户列表和构建相似受众)的支持。反过来,虚假信息宣传测试的每个新消息和受众群体,都有助于使平台算法更智能。换句话说,广告购买(包括虚假信息)越成功,后续广告购买的效果就越好,因为广告平台已经学习了更多关于最佳目标的信息。这是广告商和广告平台的良性循环——双方都能从对方的成功中受益。

三、搜索引擎优化(SEO)

搜索算法位于互联网经济的中心,每天引导着数十亿的互联网用户访问位于搜索结果页面顶部的网站。通过对谷歌搜索页面排名算法的仔细研究和逆向工程,一个价值数十亿美元的产业已经产生,这一产业致力于优化各种商业网站的搜索引擎结果,公司在优化原生搜索结果上的投入,是其购买搜索广告开销的三倍。该行业中的大多数工具和策略都是正当且公开的,目的是希望将公司网站提升到特定搜索条件的顶部。然而,其他被称为“黑帽搜索引擎优化(black hat SEO)”的技术则旨在欺骗算法,操纵新闻周期中几个小时的搜索结果,直到谷歌纠正错误。这是精准宣传的关键武器。

我们可以假设,只要这种方法仍然有效,就会持续被用于虚假信息宣传。比起推广明显的虚假内容,SEO的作用更多体现在灰色地带。恶意的虚假信息宣传,与通过宣传虚假故事和主题在经济上或政治上获利的数字媒体渠道之间的边界非常模糊。这些网站可能已经建立了合法的信誉和声望,但在某些情况下会利用SEO来放大错误信息。

我们还应该警惕SEO策略被黑客用来进行如“零日漏洞”般的攻击。虚假信息操纵者可能会找到某种不当提升搜索排名的方法,在一个特定的新闻周期中,用这种方法对某一故事进行一次性推广,赌在谷歌回应并关闭该内容之前,使该故事达到病毒式传播。值得注意的是,黑帽SEO和谷歌(或Bing和Yahoo)之间几乎没有任何利益关联。搜索结果的扭曲会损害搜索引擎品牌,使用户寻找替代品。在这一领域,各公司应与其他利益相关方合作,杜绝造成公共损害的行为。共同打击搜索引擎操纵可能成为公司、媒体、用户形成互联网共治统一战线的抓手。

四、社交媒体管理软件(SMMS)

一种新型的数字营销公司——社交媒体管理服务(SMMS)——可能是机器学习算法和广告科技最有希望产生交集的地方。SMMS为广告商提供了一种完全综合的解决方案,既包含标准的社交媒体帖子,也包含付费内容,并预先为不同的目标受众调整有着多种消息的宣传活动。社交媒体管理软件会利用复杂的行为数据分析,实时参与社交媒体监听,从而在适当的时间投放适当的信息,这种软件还能同时且自动协调多个投放渠道。该软件的测试和学习都旨在优化每一美元的说服力。对于广告商来说,这是一项卓越的创新。对于精准宣传者来说,它是一台精密的虚假信息机器。而平台提供者正在努力提供更多的自动服务,使客户能够用更少的人为参与进行媒体宣传。

SMMS行业展示出一个可能性,即广告科技的所有工具都可以被打包进宣传活动中,同时利用人力和机器智能来优化市场营销。这些日益自动化、以意外事件为基础的管理服务,使它们成为了虚假信息操纵的最佳选择,因为虚假信息操纵必须迅速对当前事件作出反应,并引导用户对新闻故事进行特定的解读。SMMS可以消化大量过去追踪的行为数据,产出人口群体精准广告参数,在新的访问者跟随原生和推广内容访问网站时,对原有参数进行调整。该服务可以同时与脸书、推特和YouTube等进行交互,同时利用其自身的数据集和平台提供的广告技术算法。

监测社交媒体情绪、制作与传播原生和宣传内容、协调多个平台和站点以创造反向链接驱动SEO,这些都是虚假信息的传播武器。这些工具本身是完全合法的,而且在很大程度上与平台的经济利益一致。在这个生态系统中,各方都可以从成功的广告宣传中受益。但这些工具使更一致的说服成为可能,削弱了民主的完整性,打开了危害公众这一弊端的大门。

五、人工智能所推动的进步

在过去的25年里,数字广告行业经历了向技术驱动的转型。在未来10年里,由于人工智能的巨大影响,创新很可能会为广告商、代理商和发布商带来更大的利润。在线广告通常涉及高度复杂的、基于意外事件的决策过程,从而在各种事件发生时,需要决定将何种类型的数字内容发送给何种受众群体。在政治环境中,这种复杂性得到了加强,因为个人对政治观点或候选人的看法是特别敏感的,因此很容易受到影响。在通过社交平台传播政治虚假信息中,人工智能及其相关的先进算法技术家族可能会在未来发挥更大的作用。

人工智能将巩固数字广告比其他所有媒体渠道更为主导的地位,使得网络上的政治广告将更加精准。从一个选举周期到下一个周期,对选民的广告投放只会越来越精确。同时,虚假信息宣传这一让人困扰的力量也会随之增长。究其根本,广告科技和政治宣传的结合,就是采用行为数据分析、受众细分和定制信息这些工具,以实现对偏见的利用。在上述每个阶段,人工智能都将发挥其先进的能力。这一前景引出了一个问题,即应该采取什么措施来阻止这种趋势,或者至少控制其对公众利益的负面影响。

六、结论

数字平台公司的商业追求与基于虚假信息宣传的政治广告商的成功之间有着利益的一致性。如何将两者的利益分离开来,是我们需要面对的核心挑战。据报道,俄罗斯的精准宣传努力是不成熟的,他们只是利用了当今信息市场中的基本工具,这些工具只是为了以低成本向数以百万计的人传播说服性信息。未来的虚假信息宣传可能会由国外操纵者,也可能由国内的操纵者来主导。完备的虚假信息宣传可能会造成严重的公共伤害。它们可以通过误导公民、使政治文化变得两极分化,从而逐步削弱民主的完整性。

未来的虚假信息操纵者将使用一系列强大的数字广告工具集来实现他们的目标。数据分析像火箭的燃料一样,推动着社交媒体平台和广泛数字营销行业的定向广告发展。越发复杂的机器学习算法将逐渐掌控未来的数据分析和定向广告。目前,在各大互联网平台上,虚假信息宣传实际上与正当广告是无法区分的,两者会使用相同的技术来影响人们,以一种以前的媒体所无法想象的方式将定向信息传播给市场。如果市场持续只关注注意力经济,这与政治上的虚假宣传结合起来,我们将再难克服虚假信息的影响。应探索有效方法,限制使用个人行为数据进行商业化的政治虚假信息精准宣传,这些方法包括限制数据收集、制定数据使用规则以及采用提高消费者的知情权和控制权。据此,本文提出面对这一挑战的一系列原则:

1. 信息透明:对政治广告制定一系列符合数字公众层面需求的透明度规定。这里的透明度至少要考虑如何标记赞助内容、如何通知阅读了虚假信息的用户、平台如何公布与政治广告相关的信息(如赞助者、花费水平和定向参数)等内容。

2. 信息安全:虚假信息和网络攻击这两种现象通常一起发生。黑客入侵电子邮件或敏感文件后将其泄露给媒体,泄露的内容通常是半真半假。如果敏感数据不安全,公民就无法确定虚假信息宣传中的信息是否是被偷来的真实信息。

3. 公众教育:消费者需要娱乐,但我们可以通过数字素养计划抵御虚假信息策略,教导用户选择更为健康的信息源。

4. 公共报道:阻止新闻的娱乐化趋势,使新闻报道不过分依赖广告收入,可以从填补社区新闻空白、关注调查性报道开始。

5. 企业责任:领先的互联网平台都采取了一系列自愿性措施,这一趋势应进一步持续,考虑为用户提供查证新闻的工具,提高展示不同观点和标记虚假信息的权限。

6. 消费者权利:使消费者更加了解应该如何控制个人数据的收集,如何使用社交媒体,以及社交媒体内容展现方式背后的技术机制。

原文PDF下载

编译 :方师师

声明:本文来自互联网研究前沿,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。