作者

光大科技有限公司大数据部副总经理 田江

光大科技有限公司大数据部大数据研究团队经理 王鹏

近年来,我国大力推动以数据为关键要素的数字经济发展,使得数据成为推动社会进步和经济增长的重要资源和要素。数据流通和分析能够为各行各业提供更高效、更智能、更创新的服务和解决方案,助力产业升级和社会福祉的增进。在此背景下,金融控股集团(以下简称“金控集团”)及其管理的金融机构开始通过数字化转型寻找新的增长点。在数字化转型的过程中,数据要素的流通和价值发挥成为关键。然而,在实践中,数据流通和分析面临着隐私和安全的挑战。如何在保护数据主体权利和利益的同时实现数据价值的最大化,成为金控集团数字化转型中亟待解决的关键问题。隐私计算技术的出现为数据安全流通和价值挖掘提供了有效的技术支持,能够很好地满足金控集团实际业务的数据协作和创新需求。

一、金控集团数据要素流通和价值发挥面临的挑战

金控集团实施数字化转型,需要对集团及各金融企业的多维度、高质量数据进行整合查询与分析,充分发挥数据的价值。但在实践中,数据的流通和加工在合规和复杂度方面仍面临较大挑战。

一方面,我国相关法律法规要求数据处理者在保护数据主体隐私权和自主权的同时,遵循合法、正当、必要等原则,明确数据处理的目的、方式、范围等信息,并采取有效措施保护数据安全;另一方面,随着金控集团数据规模和复杂度的增加,以及跨域、跨机构、跨平台等多方协作场景的出现,传统的数据流通和分析方式已经难以满足需求。传统的数据流通和分析方式通常需要将数据集中存储或直接传输给其他方,这不仅增加了数据泄露或被滥用的风险,也降低了数据处理效率。此外,传统的数据流通和分析方式也很难对使用中或运算中的数据进行保护,而这些场景中的数据往往是最敏感和有价值的。在金控集团内部存在着大量数据信息孤岛,各个组织与机构无法将原始数据整合在一起,很难联合训练一个信息密度更大、能力更强的模型,制约了整个金控集团的业务协同发展。

二、隐私计算技术助推金控集团场景建设向纵深发展

近年来,光大科技有限公司(以下简称“光大科技”)在金融客户联合统计、挖掘集团沉睡客户、客户信息准确性验证、跨平台信息互联互通等场景结合隐私计算技术进行了探索和实践,深入挖掘数据潜力,最终实现科技赋能业务、数据驱动运营的目标。

1.基于可验证秘密共享算法的跨机构数据联合统计

在大型金控集团中,各金融企业的用户信息常常是分散的,且可能存在重叠部分,也就是说不同的金融企业拥有共同的用户。对不同企业间的用户信息进行统计,有助于挖掘更多数据价值。例如,统计并分析用户在集团内的总资产信息,能够帮助金控集团联合集团内银行、保险、证券等金融企业设计整体营销方案,为用户提供个性化推荐服务,降低集团的运营成本,提升用户体验,实现集团和用户之间的双赢。

针对跨机构数据统计问题,在传统的方案中,通常会建立一个大型的数据中心。各企业将数据上传至数据中心,最终由数据中心对汇总后的数据进行统计。但随着社会对数据隐私问题越来越重视,传统的跨机构统计方法已无法满足对个人金融数据隐私保护的监管要求。如何确保数据传输的安全性和可靠性,管理和审计涉及多方交互的数据并在合法合规的前提下实现跨机构数据统计,成为重要的技术难题。

为此,光大科技基于开源联邦学习框架研发了可验证秘密共享的安全多方隐私求和方案,该方案可在没有暴露任意机构秘密值的前提下,通过联邦统计模式得到正确的统计结果,满足隐私求和的需要。联邦学习技术框架的具体实现流程分为初始化、秘密分发、秘密求和、秘密恢复四个阶段,其中发起方不仅承担普通参与方的职责,还负责执行初始化和秘密恢复两个阶段的任务。可验证秘密共享的安全多方隐私求和方案能够在明文数据不出本地的前提下,保证数据传输的安全性和可靠性,在合法合规的前提下实现对多个机构的数据求和,对不同企业间的同一用户信息进行统计,挖掘更多数据价值。

2.基于联邦半监督学习的沉睡客户挖掘模型

随着金融企业进入存量运营时代,金融机构普遍面临如何挖掘高质量存量客户的问题。金融机构拥有大量沉睡客户,通过唤醒沉睡客户、深入挖掘高质量客户来促活、盘活存量客户成为金融机构面临的重要课题。由于金融行业的特殊性,各级立法和监管机构出台了多项法律法规和监管规定,加大对个人金融数据隐私的保护力度,因此,金融机构需要在保证客户数据信息不泄露的前提下,完成沉睡客户的唤醒工作。

冷启动是一种常见的机器学习问题,是指在没有足够数据或先验知识的情况下,模型无法正确地训练和预测。沉睡客户唤醒工作与标签冷启动问题相对应,其训练数据分为有标签和无标签两个部分,金融机构可基于数据预测无标签客群的标签值,结合联邦半监督学习算法方案解决上述问题。除此之外,联邦半监督学习算法还可以解决联合建模过程中数据标注难、数据不平衡、隐私求交数量不足等问题。

3.基于跨域数据校验算法的客户信息准确性验证

金融智能化发展离不开数据的准确性。然而,现有数据的来源五花八门,金融机构需通过与外部数据进行比对验证数据的准确性,在这一过程中,保密性和安全性至关重要。因此,金融机构可以采用隐私计算技术,实现数据在加密状态下的比对校验,在保障数据安全的同时,有效评估数据质量,为金融业务决策提供可靠依据。通过加强数据治理、完善数据安全管理体系以及开展跨界合作,金融机构可以提高数据质量,为金融智能的发展奠定坚实基础。

基于隐私计算的跨域数据校验与比对模块可以在不泄露各方原始数据的前提下,将金融机构提供的客户数据按照指定字段与数据源方进行逐项比对,帮助金融机构有效利用外部数据源,实现跨域数据安全比对,提升金融智能的准确性及完备性。

4.基于异构隐私计算平台互联互通标准进行跨平台的连通

随着业务规模和数据量的不断增长,数据的价值越来越受到重视,数据被视为推动行业发展的关键要素之一。然而,如何在现有的众多金融机构隐私计算平台之间实现有效的资源协同管理和数据有序流通,已成为一个紧迫而关键的问题。这不仅需要技术上的创新和突破,还需要各金融机构之间的密切合作和协调,以共同挖掘数据潜能,推动数字经济的持续壮大。

为此,有必要在金融领域实现不同隐私计算平台之间数据的互通交流,这就需要构建一个完整的技术规范和生态支撑体系,确保金融行业内异构隐私计算平台的数据安全流通,同时又不暴露平台设计细节,也不会受到平台更新、升级和扩容的影响。实现行业级隐私计算互联互通需要以金融行业的发展需求为基础,遵循统一的数据交互标准和接口规范,支持不同技术平台的金融机构之间共同协作完成隐私计算任务,且要易于推广,从而有助于构建良性产业生态。

为实现跨机构平台的互联互通,光大科技作为传输层模块的牵头单位参与了由北京金融科技产业联盟组织的《金融业隐私计算互联互通技术研究报告》编写工作。该报告基于当前金融行业隐私计算互联互通技术的现状,制定了一套技术规范,明确了互联互通技术应具备的功能以及在安全性、安全审计、认证授权、兼容性、准确性和可扩展性等非功能特性方面的要求。其中,由光大科技牵头制定的互联互通传输层规范旨在构建一套跨异构隐私计算平台的传输准则,用于指导不同平台间算法和算子的协同工作,并进一步对传输接口、协议和报文结构等进行标准化定义,从而实现安全可控的跨平台协作。

三、未来展望

隐私计算技术可以提升数据流通和分析的多样性和灵活性,但还需考虑其所涉及的多个参与方的利益和诉求,并建立有效的协作和信任机制。例如,在应用联邦学习技术时,需要考虑平衡数据拥有者和模型提供者之间的收益分配、知识产权分配、质量控制职责等;在隐私计算中应用区块链技术进行节点管理时,还需要考虑解决共识机制、激励机制、治理机制等问题。在实现行业级隐私计算互联互通的过程中,金融行业需要以自身的发展需求为基础,遵循统一的数据交互标准和接口规范。

隐私计算技术作为一种前沿且具有广阔应用前景的技术,正逐渐成为企业和个人应对数据安全和隐私保护挑战的有效手段。这一技术通过确保数据在使用过程中的安全性,助力企业和个人实现数据价值的最大化。随着技术的不断创新、应用场景的拓展以及应用深度的加深,隐私计算技术在金控集团数字化转型过程中扮演着越来越重要的角色,并将产生深远影响。

本文刊于《中国金融电脑》2024年第1期

声明:本文来自中国金融电脑,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。