文 / 交通银行金融科技部/金融科技创新研究院总经理 李肇宁
交通银行金融科技创新研究院 钱菲 王光中
习近平总书记提出,要“发挥数据的基础资源作用和创新引擎作用”,“构建以数据为关键要素的数字经济”,“推动我国数字经济健康发展”。金融业是数据密集型行业,数据效能的充分发挥直接关系到金融服务能力和效率的提升。但是,由于金融数据的高敏感性、隐私性等特点,在数据融合运用中的困境十分突出。
交通银行金融科技部 金融科技创新研究院总经理 李肇宁
多方安全计算是破解数据壁垒的关键技术
2021年12月,国务院办公厅在《要素市场化配置综合改革试点总体方案》中提到:“建立健全数据流通交易规则,探索‘原始数据不出域、数据可用不可见’的交易范式”,“探索建立数据用途和用量控制制度,实现数据使用‘可控可计量’”。
以多方安全计算(SecureMulti-Party Computation)为代表的隐私计算技术采用基于数据价值流通而非原始数据流通的价值融合模式,可实现数据的“可用不可见”;此外,该技术可实现对原始数据按用途与用量授权使用,有效避免数据的二次流转,达到数据“可用并可控”;与此同时,该技术可通过同分布式账本、可信身份验证等技术融合,使数据使用可监督、可量化、可审计,实现数据开发利用“可控可计量”。
交通银行率先在多方安全计算技术领域实现零突破
交通银行自2019年底开始关注多方安全计算技术。经过研究分析,认为在国家数据要素化战略加快推进、顶层设计持续出台的背景下,以多方安全计算为代表的隐私计算技术可以融合大数据、人工智能、生物识别、知识图谱、区块链等技术,形成提升数据安全、保护客户隐私的综合性解决方案,在金融科技领域具有广阔的应用前景。
2020年,交通银行以加速全行数字化转型为目标,在多方安全计算领域实现多项突破:一是率先搭建多方安全计算平台,并广泛开展试点应用、持续进行技术研究;二是成功申请国内首个多方安全计算技术的金融科技创新监管试点项目(上海市第一批)“基于多方安全图计算的中小微企业融资服务”,在金融业内率先实现将多方安全计算同知识图谱技术结合应用;三是在金融业内首次将多方安全计算应用于图像隐私保护,并成功申请金融科技创新监管试点项目“基于多方安全计算的图像隐私保护产品”(上海市第二批)。图1展示了我行在多方安全计算领域的部分探索。
图1 交通银行多方安全计算技术实践
构建广泛适配场景、高安全性的多方安全计算平台
交通银行多方安全计算平台(以下简称“平台”)具有自主可控、支持结构化及非结构化数据、支持关系图谱、全流程可视化等特点。平台提供联合安全建模、联合安全统计、联合安全查询等隐私保护下的数据开发利用能力,其中涉及的密码学技术有秘密共享、混淆电路、不经意传输、同态加密、隐私集合求交、隐私信息检索、零知识证明、联邦学习等。
1.实现适配多种应用场景的架构设计。交通银行深度参与多项多方安全计算技术标准编写工作,并研制了《交通银行多方安全计算技术应用规范》。通过将这些标准中的基础思路与架构设想融会贯通,并应用于技术研究、设计、实践,整体统筹设计了关键架构,充分预留了扩展空间,使我行多方安全计算技术平台可适用多种应用场景、支持多类参与角色、适配多种数据类型、支持异构技术平台,并在数据开发利用的基础上形成了解决方案范式。
平台采取私有化部署方式,基于开放式框架,有效实现算法模型与平台的解耦,并支持自定义算法组件,可以更好满足多元业务场景的协同计算与建模需求。平台架构分为5层,如图2所示,主要包含基础设施层、数据资源层、安全计算引擎、安全接口层、可视应用层、系统管理层、HUB服务层。
图2 交通银行隐私计算平台
基础设施层主要包含计算资源、网络资源、存储资源等,通过对本地节点及节点间的链接管理,建立起金融大数据多方合作的安全可控环境。
数据资源层可支持对接多种不同类型的数据资源,包括关系型数据库、非关系型数据库、文件及三方数据接口类型,如hive、csv文件等。
安全计算引擎是安全计算平台的核心模块,提供整套的安全计算基础组件,为平台实现数据安全匹配、数据安全计算、加密查询和模型运算等服务提供支撑,并实现可编排的算法工作流。其中匿踪查询功能模块可执行匿踪核验、匿踪检索两种应用的相关运算能力;多方安全计算模块提供基于Python、SQL的编译环境执行能力,以及多方统计、多方计算的运算能力;联合安全建模模块提供机器学习、特征工程、模型预测的计算执行能力;多方安全匹配模块提供安全求交、安全求补、安全求并的功能。此外,还提供一系列的基础组件,包括加密算法组件、加密协议组件、机器学习算法组件、基础运算算子组件、统计运算算子组件、数据融合组件。通过这些基础组件可以组合实现复杂运算与算法、应用流程。
安全接口层主要实现对匿踪查询、安全匹配、联合统计、安全建模等应用提供接口封装。
可视应用层对多方安全计算的应用执行提供可视化工具,实现分析预测报告、安全驾驶舱、开发Studio等功能。
系统管理贯穿服务始终,提供用户管理、商户管理、算力管理、节点管理、密钥管理、授权管理、数据管理、系统监控等公共调度和管理功能。
HUB服务是交通银行多方安全计算平台用来实现与其他跨厂商的多方安全计算引擎之间互联互通的适配器,能够实现节点资源、数据资源、模型资源的互通与共享,内含资源注册、资源发现、资源授权、统一资源协议等组件。
基于上述技术组件提供的基础能力,可以实现交通银行与其他外部机构之间的安全数据协同应用,包括智慧风控、精准营销、反欺诈、用户运营、联合统计、安全查询等,在原始数据不转移不汇集的基础上,更加高效、准确地使用数据、合法合规地进行金融大数据协同建模与计算。
2.实现基于国密的高性能、高安全性多方安全计算。平台采用国密算法SM2/SM3/SM4,设计了符合国密标准的多方安全计算密码模块,对多方安全计算协议进行安全加固及性能提升,实现了算法及安全的自主可控。相比于传统多方安全计算技术实现,在提升加密速度的同时降低了CPU占用率及网络消耗,进而提升技术应用能效,为多方安全计算技术的大规模生产应用提供技术基础。
3.实现全流程可视化、图形化操作。多方安全计算平台将计算任务设计为全可视化流程,使平台使用人员可以图形化地了解、设计、运行相应计算流程,并实时管理相关内容。
在整体管理层面,平台提供了全国、地区、合作机构三个层次的管理视图,可实时掌握多方安全计算技术在全行范围内的整体运行情况,并可及时发现、定位、解决异常情况,进行事件报警。
在任务操作层面,平台实现了全流程可视化操作,并支持采用拖拉拽形式实现算法配置及整合,支持将跨机构间的匿踪查询、安全统计、安全建模、安全预测、模型部署等任务可视化、配置化管理,降低了数据分析人员对多方安全计算技术的理解难度及操作难度,可高效、灵活地应对多样化数据融合场景。
基于多方安全计算技术释放数据融合价值
在实际业务驱动下,交通银行已应用多方安全计算技术由点及面开展了多种应用创新,尝试从交通银行角度积极探索和实践未来数字化新基建。
在智慧风控场景中,通过多方安全计算平台可实现金融机构同第三方数据供应商联合建模,并共同搭建审批模型、欺诈模型、贷后行为模型,判断企业实际经营情况,防范潜在的多头授信、空壳授信等问题,在授信流程中及时发现经营情况不真实、业务数据不准确等情况。
在智慧营销场景中,可通过多方安全计算平台提供的多方数据虚拟融合能力,在产品营销、高价值客户提升、潜力客户提升、目标客户筛选优化等方面,实现数据不出门的客户联合精准画像安全建模,提高营销获客精度。
在生物识别场景中,通过平台提供的数据加密分片存储及加密分片运算能力,可将人脸信息等隐私数据分片后分别存储在不同机构,并在验证环节进行安全比对,进而实现在各参与方不进行存储特征交换的前提下完成特征校验。最终提升了对图像隐私信息的保护能力,降低信息泄露风险。
未来,多方安全计算技术可广泛应用于多种金融业务场景,将上游的数据源、金融业务,以及终端用户紧密联系在一起,释放数据要素红利,助力“智能金融”发展。展望未来,金融机构将携手共进。
一是逐步扩大“可用不可见、可控可计量”的数据应用场景,发挥数据要素价值。数据价值的发挥,要坚持合规发展、安全发展,遵循和敬畏国家法律和金融规律。通过进一步运用多方安全计算等技术,可提升数据交换、流通的便捷性,进而逐步挖掘依法合规、保护隐私、提升安全、具有金融应用价值的数据合作场景,降本增效,形成健康完备的金融数据应用方案。
二是积极建设多方安全计算合作生态圈。推动多方安全计算有序发展,需要从多方协同,联合打造数据要素融合应用的良性生态。一方面在制度层面遵循法律法规,明确数据安全保护要求,同时积极拥抱新思维、新方法、新模式,探索解决问题的新途径;另一方面积极与政府、高校、金融同业、科技公司、投资机构等外部合作伙伴开展广泛技术和业务合作,建立合作生态,打通“产学研用”,推进技术攻关和合作创新。
三是多方安全计算应用应注重科技向善、数据平权。在推进技术应用及合作生态的进程中,要坚持科技向善的创新原则,强调将服务国家战略、支持实体经济、满足人民美好生活向往作为创新的出发点和落脚点;要坚持“数据平权”的价值理念,运用数据更好地解决信息不对称,而不是利用数据垄断和技术壁垒来加剧信息不对称,综合发挥多方数据优势,切实提升金融服务质效。
声明:本文来自金融电子化,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。