引言

2020年3月,中共中央国务院公布了《关于构建更加完善的要素市场化配置体制机制的意见》,其中定义了五大生产要素:土地、劳动力、资本、技术和数据,并明确要求促进政府数据的开放共享,提高数据要素的价值,同时加强数据要素资源的整合和安全保护。2021年6月10日,中共中央颁布了《中华人民共和国数据安全法》,标志着数据要素安全正式进入依法规范、依法治理的新发展阶段。2022年4月,中共中央国务院公布《关于加快建设全国统一大市场的意见》,再次强调要加快培育统一的数据市场。科学认识、统筹谋划、有序推进数据要素统一市场建设势在必行。由于数据本身具有与传统市场要素不同的特点,如流动性、多样性和可复制性,数据安全风险在数字经济时代不断放大,数据要素的安全治理也因此越来越重要。

一 数据要素安全治理的内涵

数据安全治理的内涵可以分为广义和狭义。广义上讲,数据安全治理就是要从国家数据安全战略的角度,在国家相关法律和意见的指导下,为全社会创造有利环境,共同维护数据安全,促进发展。具体来说,就是由国家部门、行业组织、研究机构和个体企业共同参与,完善相关政策法规,推动政策法规的实施,建立和实施标准体系,开发和应用关键技术,培养和锻炼专业人才。狭义地说,数据安全治理是指在组织的数据安全战略指导下,由多个部门共同实施的一系列活动,以确保数据得到有效保护和合法使用。主要包括建立数据安全治理团队、制定数据安全规范、构建数据安全技术体系、建立数据安全人才梯队等。它以保障数据安全、促进开发使用为原则,围绕整个数据生命周期构建相应的安全体系,需要组织内部多个利益相关方统一共识,共同平衡数据安全与开发。

无论广义还是狭义,它们有三个共同要点:1)数据驱动;2)多元主体协同参与;3)统筹数据要素发展与安全。

得益于海量数据的开发利用,当前大数据、人工智能技术日益蓬勃发展,即技术的发展以数据要素为基础。数据的高效开发使用包含数据的采集、传输、存储、使用、共享、销毁等全生命周期的各个环节,由于不同场景、不同环节特性不一,面对的数据要素安全治理也大不相同。因此,必须构建数据安全治理体系,根据具体的业务场景和各生命周期环节,有针对性地识别并解决其中存在的数据要素安全问题。

数据要素的安全治理无法依靠单一方的力量进行开展。面对数据安全治理领域的诸多挑战,政府、行业协会、企业和个人都要发挥主观能动性,共同协作,紧密配合,承担数据要素安全治理的主体责任,积极投身《数据安全法》,建立各方共同参与的工作机制。

数字经济时代下,数据只有在流动中才能充分发挥要素价值,在发挥数据要素价值的过程中又必须保障数据安全。因此,数据安全治理绝不是单纯的数据安全,也有数据流动发展的内涵。随着数字化建设的蒸蒸日上,社会各部门、相关组织与企业积累了大量的数据,如何安全地利用数据要素发挥价值是数据安全治理的核心内涵。数据安全治理不是强调数据的绝对安全,而是统筹数据要素发展与安全。从技术的角度,隐私计算技术为数据安全治理提供了一种解决方案。

隐私计算技术在数据安全治理中的实践探索

隐私计算是指在保证数据所有方不泄漏原始数据的前提下,多方联合对数据进行分析计算的一系列技术,在保障数据要素流通下实现安全保护,即“可用不可见”。Gartner发布的《2022年重大战略技术》指出,预计到2025年,60%的大型机构将使用一种或多种隐私计算技术。随着多方积极参与布局,技术可用性的快速迭代、,隐私计算技术在各行各业落地,为数据要素安全治理提供了一种解决思路。

隐私计算技术是多学科交叉融合的结果,目前主流的隐私计算技术主要分为三大类:第一类是以多方安全计算为代表的密码学隐私计算技术,第二类是以联邦学习为代表的人工智能与隐私保护技术相结合的隐私计算技术,第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。

隐私计算不仅可以增强数据流通过程中对数据要素安全的保护,而且也为数据的融合应用与价值释放提供了新思路。从底层硬件上说,多方安全计算与联邦学习通常从软件框架层面基于通用硬件实现数据安全治理,可信执行环境则是以可信硬件作为核心实现数据安全治理;从算法上说,多方安全计算和可信执行环境通常是基于密码学算法设计不同的安全协议,联邦学习是基于人工智能技术和差分隐私技术相结合。当前隐私计算技术处于飞速发展阶段,多方安全计算、联邦学习和可信执行环境呈现出互相融合的趋势,在更多更广泛的场景中实现数据安全治理。

当前隐私计算技术应用主要集中在有大量数据要素积累且有实际数据流通需求的医疗、政务、金融等领域,参与方多为跨机构、跨行业用户,目前最成功的应用主要集中在联合营销、风控与医疗、电子政务等场景。

虽然当前隐私计算技术在数据要素安全治理中已有一些应用,但仍面临诸多挑战。一是隐私计算效率不足。对于数据流通迫切的行业如医疗、金融等,具有数据密集、高价值、高敏感特性,数据要素流通的关键是隐私计算技术的大规模高性能稳定计算。当前隐私计算技术基于分布式密文计算实现数据流通,但密文计算需要更大的计算和通信负载,且存在同步性问题,导致隐私计算在金融业、医疗等行业发展存在性能瓶颈。二是隐私计算缺乏标准适配。不同行业不同场景数据安全规范不一,需要隐私计算应用的细化适配。同时不同隐私计算平台存在算法原理的差异性和系统功能的多样性,对跨行业隐私计算平台互联互通具有挑战性。三是隐私计算安全信任较差。关键领域数据关系民生安全,具有高价值高敏感特性,当前隐私计算技术算法协议尚无法实现绝对安全,跨行业的开发应用安全同样面临挑战,安全性共识有待形成。

针对上述挑战,我们的建议是:

(一)优化隐私计算效率

目前的隐私计算通常是基于密码学实现多方协同计算,联合建模所需时间是传统集中式机器学习的数十倍甚至数百倍,联合推理所需时间也是传统集中式推理计算的数百倍;同时,多方协同计算存在通信负荷和异步性,导致隐私计算的效率不足。金融、医疗和电子政务等作为关键基础设施的重要组成,拥有海量的数据积累,隐私计算效率是影响其能否实现数据要素价值挖掘的关键的一个重要因素。因此,隐私计算应用平台需要优化性能以提升可用性。

建议基于国产自主可控设备和技术,从算法优化和硬件加速两个层面积极开展隐私计算应用技术探索,研究新的密码学技术和算法协议,结合加速硬件、专用通信算法实现隐私计算效率优化,支持数据要素安全发展。

(二)制定隐私计算标准体系

对于数据拥有机构和应用机构来说,在与不同的机构合作时,通常不得不部署不同的隐私计算平台,从而造成系统的重复建设和运营成本的浪费,而隐私计算公司和产品的多样性又加剧了这种情况。由于不同的隐私计算平台多是基于闭源的算法与系统设计,存在算法原理的差异性和系统功能的多样性,很难完成跨平台信息的交互。隐私计算平台在应用中存在数据群岛现象,互联互通壁垒成为阻碍隐私计算技术落地的新挑战。与此同时,隐私计算平台多是针对通用场景计算,目前尚无相关隐私计算标准指南与应用实践具体结合,在数据要素流通的迫切需求下,亟需制定关键行业数据合规流通细则文件,从而细化隐私计算应用的监管要求。

建议完善隐私计算相关标准,促进隐私计算平台应用规范化。依据《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《关键信息基础设施安全保护条例》和《征信业务管理办法》,推进隐私计算应用平台规范化、标准化。积极推动隐私计算应用平台互联互通的可行方案落地实践,有效降低应用成本,挖掘数据要素价值。

(三)推进完善可信隐私计算

安全可证是可信隐私计算的核心问题。隐私计算通过交流加密中间参数、梯度等信息,或通过在可信受控环境中对数据进行处理的方式,保障了数据的安全性,提高了数据流通的主动性和规范性。但隐私计算的安全性自证是技术应用过程中面临的难题,考虑数据安全治理面向关键基础行业,隐私计算应用平台安全边界要求极高,亟需推进完善可信隐私计算。

建议积极探索隐私计算各分支技术间、隐私计算与外部技术间的融合方案和验证平台,为数据可信流通提供技术支持。开展可信隐私计算评测,优化可信隐私计算产业生态。隐私计算是一项复杂的系统化工程,需要各方共同参与,应充分发挥政府机构示范带头作用,搭建合作交流平台,广泛吸纳行业优秀的实践经验,围绕可信隐私计算关键要素,加快研发自动化评测工具,全方位多角度地开展评估测试,持续规范可信隐私计算技术应用落地,促进数据安全治理与应用。

本文作者系复旦大学吕智慧,陈鹏,柴洪峰。

声明:本文来自上海数据交易所研究院,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。