当前,随着自动化操作技术变得更容易获取,社交媒体继续为病毒式内容传播共享提供成熟的环境,操纵多模态媒体(包括音频、图像、视频和文本)的威胁日益增加。能在社会上引领舆论风潮者已不再局限于传统上拥有大量资源和专业知识的机构和团体。现如今,个人内容创作者可以使用一些功能,这些功能可以帮助其开发经过修改的媒体资产,从而创建可信但内容虚假的交互或场景,如前段时间国外的“深度伪造(deepfake)”以及近日国内闹得沸沸扬扬的“ZAO-逢脸造戏”的换脸APP。

“在媒体操纵和社交媒体的交叉点上,存在虚假信息的威胁,意图对受众产生负面影响并引发骚乱,” 美国国防高级研究计划局(DARPA)信息创新办公室(I2O)的项目经理马特·图雷克(Matt Turek)博士表示:“虽然这听起来像一个可怕的命题,但事实是并非所有媒体操纵都具有相同的现实世界影响。多年来,电影业界一直使用复杂的计算机生成编辑技术来创建引人入胜的图像和视频以用于娱乐目的。但更多恶意的被操纵媒体也被用来攻击诋毁声誉、政治进程和社会的其他关键方面。确定媒体内容是如何创建或改变的,它试图实现的反应以及由此负责的人,可以帮助快速确定它是否应被视为严重威胁或更为温和的事物。”

虽然统计检测技术已经成功地揭示了一些媒体操纵,但单纯的统计方法不足以解决媒体生成和操纵技术的快速发展。幸运的是,用于创建伪造内容的自动操作功能通常依赖于需要数千个或更多训练示例的数据驱动方法,并且容易产生语义错误。这些语义错误为该类事件的防御者提供了获得优势的机会。

为应对媒体操纵事件,DARPA发起了语义取证(Semantic Forensics,SemaFor)项目,旨在开发使伪造媒体资产的自动检测、归属和表征成为现实的技术。SemaFor项目的目标是开发一套语义分析算法,大大增加伪造媒体创作者的负担,使他们极难创建引人注目且难以发现是被操纵的内容。

为了开发跨媒体模式和大规模使用的分析算法,SemaFor项目将创建工具,当结合使用时,可以帮助识别、阻止和理解伪造的多模态媒体。SemaFor项目将专注于三种特定类型的算法:语义检测、归因和表征。

SemaFor项目将集中于4个技术领域(TA):

技术领域1(TA1):多模态媒体资产的检测、归因和特征描述。 预计会颁发多个合同;

技术领域2(TA2):解释和整合,将结合TA1演示验证团队的结果,为系统决策提供解释,并为分析师审查确定资产的优先级。 TA2还将开发原型SemaFor系统。 预计将颁发一个合同;

技术领域3(TA3):评估,将生成和策划多模态媒体以进行评估,设计项目评估,建立人员基线绩效,并制定其他项目指标。 预计将颁发一个合同;

技术领域4(TA4):挑战策划,将不断为该项目提供最先进的(SOTA)挑战,以测试TA1和TA2开发的技术。 TA4还将开发具有前瞻性的威胁模型,以预测未来的威胁并确保SemaFor防御集中在正确的区域。 预计会颁发多个合同。

语义检测算法将确定是否生成或操纵多模态媒体资产,而归因算法将推断媒体是否来自声称的组织或个人。确定媒体是如何创建的,由谁来帮助确定其创建的更广泛的动机或理由,以及伪造者所掌握的技能。最后,表征算法将推断是否为恶意目的生成或操纵多模态媒体。

另一方面,Turek解释说:“改变媒体用于娱乐或艺术目的的操纵与改变媒体以产生负面现实世界影响的操纵之间存在差异。在SemaFor项目上开发的算法将帮助分析师自动识别和理解因恶意目的而被伪造的媒体。”

SemaFor项目还将开发技术,使人类分析师能够更有效地审查被操纵的媒体资产并确定其优先级。这包括整合检测、归因和表征算法提供的定量评估的方法,自动确定媒体的优先级,以便进行审核和响应。为了向分析师提供可理解的解释,SemaFor项目还将开发自动组装和策划检测、归因和表征算法提供的证据的技术。在项目的整个生命周期中,SemaFor技术将针对一组代表新的或新兴威胁情景的日益困难的挑战问题进行评估。

声明:本文来自从心推送的防务菌,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。