摘自:《网络安全技术和产业动态》2022年第10期,总第28期。
隐私计算是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算,有效提取数据要素价值为目标的一类信息技术,保障数据在价值转化中“可用不可见”。
当前正处于全球数字经济发展的重大战略机遇期,数据要素价值化进程也正在加速进行。在数据安全和数据流通需求的双重推动下,隐私计算成为数据要素价值安全释放的“技术解”之一,越来越受到业界的关注和重视,在金融风控、营销推荐、智慧政务、智慧医疗等领域的应用越来越广泛。
01 技术发展情况
(一)技术发展历程
隐私计算的发展历程大致可分为萌芽期、探索期、成长期、应用期四个阶段。
萌芽期(1949年—1982年),以现代信息学之父克劳德·香农为首的密码学家开启了现代密码学时代,秘密分享、不经意传输、安全多方计算等主流技术先后被提出,奠定了隐私计算的基础。
探索期(1983年—2005年),零知识证明、混淆电路、半同态加密等协议和算法陆续出现,为隐私计算提供技术支撑。
成长期(2006年—2018年),多个隐私计算技术、方法纷纷涌现,包括差分隐私、全同态加密、联邦学习、可信执行环境等,隐私计算技术得到了快速发展。
应用期(2019年至今),隐私计算开始广泛与行业应用场景相结合,赋能数据价值的安全、合规流转。
(二)技术对比分析
当前,隐私计算逐渐形成了多条技术路线,包括:以安全多方计算为代表的基于密码学的隐私计算技术、以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术、以可信执行环境为代表的基于可信硬件的隐私计算技术。
不同的隐私计算技术在计算性能、通用性、安全性、安全机制、可信方等方面都存在差异。
(1)安全多方计算基于密码学安全,包括多个技术分支,主要有秘密分享、不经意传输、混淆电路、同态加密、零知识证明等技术,其安全性有严格密码理论证明,计算准确度高,但计算量最大,性能较低,更适用于数据量适中但保密性要求较高的重要数据应用。
(2)联邦学习技术具有分布式训练和联合训练的特点,具有本地数据不需要流出的优点,但缺点是很难做好隐私性、模型精度和收敛性能之间的平衡,更适用于参与用户多、数据特征多且分布广泛的联合计算应用场景。
(3)可信执行环境为程序、数据提供了一个安全可信的环境,同时在计算性能上具有较大优势,但信任链通常需要绑定CPU厂商,适用于能够部署和应用可信基础环境的应用场景。
在实际选择时需要综合考虑行业特点、业务场景、客户需求等,从而扬长避短,充分发挥隐私计算的价值。
02 技术发展难点
我国隐私计算发展具备一定优势、存在广阔应用空间,但由于技术发展仍不完善,当前也面临着数据合规、计算性能、标准规范等技术发展难点,具体包括:
(一)数据合规难以保障
隐私计算技术需要基于各参与方的数据源进行数据的融合计算。目前,将个人信息用于隐私计算,以及如何在符合个人信息保护的要求下使用隐私计算技术,现有法律法规及相关标准等并无明确界定。
(二)标准规范有待健全
国内隐私计算技术应用仍处于起步发展阶段,目前已经有一些国际标准、行业标准和团体标准正在制定中,还缺乏相关的国家标准。不同的异构平台由于缺乏标准规范的指导,容易各自发展自成体系,不利于各机构开放融合以及行业健康发展。
(三)计算性能有待提高
隐私计算技术的性能相比明文计算慢很多,存在性能瓶颈。主要原因包括:安全多方计算和联邦学习由于使用加密算法导致计算量以几何级增长,另外,由于受到通信资源、算力、运行环境等制约,性能最弱的参与方或者计算节点成为整个网络的计算瓶颈等。
03 产业落地情况
(一)产业规模及厂商情况
根据艾瑞咨询报告《中国隐私计算行业研究报告:云程发轫,精耕致远》,2021年中国隐私计算市场规模为4.9亿元。2021年中国隐私计算基础产品服务的技术采购中,金融、政务、运营商占据75%—80%的市场份额,医疗领域占比约为10%。
国际巨头从2015年起,在隐私计算方面进行产业布局,既有Google、微软、IBM、Intel、三星等巨头布局隐私计算的核心技术,也有infosum、Owkin等初创公司,在细分的技术领域进行深耕。
国内从2018年开始,腾讯、阿里、蚂蚁、京东、百度、字节跳动等互联网龙头企业,富数、同盾、华控清交、锘崴科技等初创型科技企业,都在隐私计算方面进行产业布局。此外,中国移动、工商银行、农业银行、建设银行、招商银行、微众银行、平安集团等行业数据高度聚合企业涌入隐私计算领域,开展数据增值业务。
由于隐私计算有多种技术路线,很多厂商在联邦学习、安全多方计算、可信执行环境等多个技术路线上都同时进行布局。以腾讯为例,腾讯具备Angel PowerFL隐私计算框架、安全隐私计算平台、联邦学习平台等多套平台,既可以保障数据安全和用户隐私,又能够挖掘多方数据协同应用带来的价值。
(二)技术应用情况
隐私计算技术目前在金融、政务、医疗、互联网等数据密集型行业开展了应用,促进数据资源开放共享,释放数据价值。
在金融风控场景中,隐私计算技术被用于在各方原始特征不出域的前提下建立风控模型,形成对业务的多维度认识,提升风控质量。
在政务场景中,隐私计算技术被用于搭建政务公共数据密文开放共享交换平台,实现政务数据的开放和共享,充分发挥数据融合价值。
在互联网营销推荐场景中,隐私计算可以用于帮助互联网机构之间共享和交换密文数据,实现对已有客户的精准推荐,以及进行数据协作,实现获客引流。
在医疗领域中,隐私计算技术主要用于跨医疗机构之间的数据共享流通,用于临床辅助决策、医学研究等。
04 意见和建议
结合我国实际情况,建议从健全法律法规、推进标准建设、提升计算性能等方面,推进隐私计算技术的进一步发展。
1.健全数据要素安全流通的法律法规
建议进一步制定和健全数据要素安全流通的法律法规。进一步明确数据分类确权制度,对数据产权归属进行界定,明确各方主体的法律责任,明确按照数据权属确定可交易流通数据的类型、范围和流通规则等。
2.推进隐私计算的标准体系建设
建议进一步推进隐私计算的标准体系建设,重点加强隐私计算的国家标准制定,对隐私计算的定义、范围、技术体系、安全要求等进行规范化。同时,积极参与国际标准制定,将我国的产业实践贡献到国际标准中。
3.通过算法优化和硬件加速提升性能
建议隐私计算的科技厂商和学术机构,通过算法加速、通信加速、代码加速等方式,进行算法优化;通过硬件加速技术、算法优化等方式,对计算量较大的环节和步骤进行加速,从而有效提高计算性能。
中国网络安全产业联盟(CCIA)主办,深圳市腾讯计算机有限公司供稿。
声明:本文来自CCIA网安产业联盟,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。