基于隐私计算的商业银行数据要素流通应用场景研究

作者：潍坊银行零售银行部魏建国

在信息科技迅猛发展的背景下，商业银行面临着前所未有的海量数据管理和应用挑战。2023年底，国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》，将“数据要素×金融服务”列为重点任务之一，明确指出推动金融信用数据和公共信用数据、商业信用数据共享共用和高效流通。围绕基于隐私计算技术的数据要素流通应用场景，笔者以提高业务效率和数据管理水平为最终目标，尝试梳理了商业银行助力数据要素流通的可行路径，以更好推动金融业务可持续发展。

一、数据要素流通的底层逻辑

作为构成数据的基本单位，数据要素可以是字段、记录和图表等，而数据要素流通则是促进数据要素市场化和价值化的重要手段。通过流通，商业银行将可以实现数据的使用、交换和共享，从而激发数据价值的进一步释放。

1.数据共享与流通

数据共享与流通既是商业银行主动参与数据要素市场化的突破口，也是全力实现高质量发展的内驱力。商业银行通过构建数据共享能力体系和数据要素经营体系，有助于推动内部业务数据的高效融合以及“数据—金融—产业”生态的良性循环。

2.数据融合与应用

通过不断深化内部数据与教育、交通、旅游等行业数据的相互融合，商业银行可加速推进智慧政务和便民金融服务建设。以潍坊银行为例，通过主动和政府相关部门对接，潍坊银行积极引入政务公开数据，推出了“惠民贷”“信速贷”等创新融资产品。与此同时，通过开展政务数据合作、落地政务合作场景，商业银行也可不断挖掘数据资产潜能，做实、做活、做强数据资产。

面向金融场景，隐私计算技术在数据安全保护、数据价值释放、业务创新推动、客户体验提升以及推动行业发展等方面均表现出较高的应用价值：一是提升数据安全性，确保数据应用、流通过程符合国家法律法规要求；二是促进各行业数据共享，提升业务效率；三是赋能商业银行数字化转型，加速拓展新的业务场景；四是增强客户对商业银行服务的信任，优化服务体验；五是促进数据要素流通，推动金融行业创新发展。

二、隐私计算在数据要素流通场景的典型应用

商业银行数据价值的提升离不开数据要素的有效流通。从隐私计算的角度来看，商业银行主要涉及以下四类流通场景。

1.共享数据流通场景

当前，商业银行主要通过合规方式从政府部门或征信机构购买所需的数据信息，依据关键字段获取数据定位，再对相应数据进行进一步加工，导致全过程的风险暴露面较大。而隐私计算技术则能够规避对关键字段的依赖，提供一种充分满足合规要求的数据采集方式，其不仅是对商业银行现有数据应用场景的升级和扩充，而且将加速推动数据要素的价值流通。

2.精准营销数据场景

商业银行基于隐私计算技术，可以在保障客户隐私和数据安全的前提下，通过将内部金融产品与数据提供商的合规数据信息进行联邦建模训练，使目标客户批量化，并以此为基础提供更为个性化、精准化的金融服务。以商业银行与运营商、中国银联等第三方纵向联合建模为例，商业银行可通过持牌征信机构接入三网覆盖的运营商数据(包括通信稳定性、金融App稳定性、月均消费、终端偏好、异常线下消费、多头安装/浏览/使用、深夜电话、被催收强度等信息)，并据此搭建营销响应模型、贷前风控模型、贷中风险模型和全链路风险模型等四类模型。

其中，营销响应模型是一种机器学习模型，可用于预测潜在客户对于特定市场营销活动的响应概率。通过使用营销响应模型，商业银行将能够更加精确地识别潜在客户，提高市场推广的效果，减少资源浪费，并最终提高营销活动的回报率。营销响应模型应用场景见表1。贷前风控模型是金融领域中常用的一种机器学习模型，其基于借款人的个人信息、财务状况和其他相关数据，可快速评估客户信用风险。贷前风控模型应用场景见表2。贷中风险模型是一种主要用于评估贷款周期中违约风险隐患的模型。贷中风险模型应用场景见表3。全链路风险模型通过综合考虑各环节风险，支持对单个业务或整个生命周期的各个阶段进行全面风险评估。全链路风险模型应用场景见表4。

表1 营销响应模型应用场景

表2 贷前风控模型应用场景

表3 贷中风险模型应用场景

表4 全链路风险模型应用场景

3.数据产品输出场景

面向数据产品输出场景，隐私计算技术在保护客户隐私安全、提高数据处理效率的基础上，还可有效促进数据共享与协同应用，例如推动商业银行与其他金融机构合作，共同挖掘数据价值，或帮助商业银行确保数据处理和输出符合法规要求，实现合规经营。

依托标签体系建立客群画像是商业银行输出数据产品的主要场景。例如，证券公司通过与商业银行合作，可采用联邦学习模式来获取目标客户，而商业银行则可通过输出数据产品来获得中间业务收入。在此过程中，通过联邦聚合的方式(即多个参与方在不共享原始数据的情况下进行合作学习的过程)，多家机构可共同训练出一个更好的模型用于对共有客群进行全量打分，并通过私有信息检索来优化客户标签，最终寻找出目标客群中高响应、低风险的高价值客户开展精准营销。

4.多数据源价值比较

基于精益思维，隐私计算可以用于多个数据源的价值比较。数据源价值主要体现在数据质量、场景和模型等三个维度。其中，数据质量维度主要指从数据的空值率、异常值等方面对数据源进行比较，一般可通过数据分布进行展示。场景维度是指数据与地域或行业的匹配度，主要依据隐私计算PSI得出的交中量和交中率、空值条数和空值率、重复样本和重复率等对数据源进行比较。模型维度是指特定场景下的模型特征贡献度，主要依据模型特征的IV值评估特征变量的预测能力、依据KS值评估模型风险区分能力、依据AUC值等来评估模型性能。

在实际场景中，数据质量、场景和模型维度下各类评估参数的权重可根据商业银行自身偏好决定。以数据质量维度下的空值率为例，部分商业银行规定空值率不能高于千分之五，但有商业银行觉得百分之一也同样可以容忍。

综上所述，为更好地激活数据要素潜能，发展新质生产力，商业银行特别是中小银行通过引入隐私计算技术，将可进一步强化数据安全和隐私保护，完善数据运营场景布局，从而在全面提升数据运营能力的基础上，加速推动银行业务和场景创新，持续打造个性化、特色化金融服务。

本文刊于《中国金融电脑》2024年第9期

声明：本文来自中国金融电脑，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

基于隐私计算的商业银行数据要素流通应用场景研究

比特币创新高，特朗普组建“加密政府”

关于信息科技外包风险管控的探索与研究

“支付宝崩了”冲上热搜，官方致歉