作者简介

梁 伟:中国电信股份有限公司北京研究院高级工程师,博士后,主要研究方向为区块链、人工智能、云计算、数据中心、未来网络等。

张 政:中国电信股份有限公司北京研究院工程师,主要研究方向为区块链、云计算等。

冯 明:中国电信集团有限公司科技创新部高级工程师,主要研究方向为云计算、大数据、智能网络等。

何志强:中国电信集团有限公司科技创新部总经理,主要研究方向为云计算、大数据、区块链与人工智能等。

论文引用格式:

梁伟,张政,冯明,等. 基于区块链的可信数据交换技术与应用[J]. 信息通信技术与政策, 2020(4):91-96.

基于区块链的可信数据交换技术与应用

梁伟1 张政1 冯明2 何志强2

(1. 中国电信股份有限公司北京研究院,北京 102209;2. 中国电信集团有限公司科技创新部,北京 100032)

摘要:基于区块链的可信数据交换技术能实现去中心化网络中隐私数据的保护与流通,推动数字化时代打破“数据孤岛”壁垒。文章分析了可信数据交换的背景和需求,阐述了基于区块链可信数据交换及其关键技术,并结合区块链底层基础设施平台展示了应用情况。

关键词:区块链;数据交换;隐私计算

1 引言

数据是人类文明传承的重要媒介,是信息时代的命脉。随着云计算、物联网等信息化技术的快速发展,海量的数据不断涌现,据IDC统计,2018年中国数据量达到了7.6ZB,预计数据量在2018—2025年间将保持30.4%的年平均增长率,并在2025年达到48.6ZB,预计中国将有近10亿互联网用户,其中蕴含的数据价值难以估量。特别是在数字经济时代下,政务信息公开的需求日渐强烈,政府对政务数据的共享和保护也持开放态度。但由于政府部门间数据系统的差异化,导致多部门之间形成若干数据孤岛。数据孤岛的存在严重制约数据价值的释放,如何挖掘数据间潜在联系,发挥数据流动的价值,通过数据共享打通数据壁垒,将成为助推数字化社会发展的必经之路。

目前的数据交换和共享方式,诸如云计算、云存储和云分享等模式[1],都是基于中心化服务器的设计理念,当民众来政务门户平台办理某个政务事项,中心化的共享平台依据事项的材料清单向各个部门取数据,或是各个部门定时向中心来推数据,解决了政务数据共享难题。而中心化的数据共享方式,将带来数据所有权、隐私安全等诸多问题,具体来说,主要有以下几个痛点问题。

(1)数据安全性。对于政府部门而言,在某些数据开放的场景中持保守态度,如天眼系统,其中所采集的人口流动、行为习惯等数据是国家安全战略的重要部分,数据的随意公开可能会影响到国家的安全问题,敏感数据使得政府缺乏数据共享的动力。

(2)隐私性。数据共享方需要对自己隐私数据的使用有知情权、控制权和拒绝的权利,传统共享方式易使共享方丢失数据拥有权,隐私数据一旦分享就面临无限次传播的风险,数据侵权时难以确责,导致很多数据拥有方参与数据交换的意愿不强,造成数据不想给、不愿给的局面,成为制约数据共享交互的瓶颈。

(3)统一标准。现有政府各部门所采用的信息系统都互相独立,底层架构不一样,数据采集方式不同,数据处理规则和存储的格式也有所差别,导致各独立信息系统间难以整合互通,造成数据共享难、实时性差。

(4)数据寡头。提供数据交换和共享功能的中心化机构会囤积大量的机密数据,导致数据垄断,形成数据寡头。在数据所有权和数据安全共享之间找到合适的平衡点,是数据交换亟需解决的核心问题。

2 区块链隐私计算解决的问题

区块链由比特币衍生[2],提供了无中心化机构管理的情况下,在陌生节点间建立信任的新机制。区块链以其公开共享、去中心化、不可篡改、可追溯和不可抵赖等优势[3],吸引了包括金融业、医疗业和政府部门等众多利益相关方的极大兴趣,被认为是解决数据安全交换问题的合适方案。基于区块链建设可信数据交换平台,通过安全多方计算、智能合约技术[4]、非对称加密技术[5]等控制用户对数据的访问权限,解决数据隐私安全和数据主导权等问题,打破政府、企业间的数据孤岛壁垒,实现数据融合,形成更加安全、开放、高效、可信的数据交换生态系统。基于区块链的可信数据交换技术具有以下几项核心功能。

2.1 数据目录管理

由于区块链中每个区块的存储容量很小,无法提供存储大量数据的功能,因此将待共享数据一次性上链显然不合理,故将需要共享的数据目录存储至区块链上,实现共享目录可追溯不可篡改,同时对于敏感数据而言,仅向数据业务相关方公布共享数据目录列表,保护敏感数据隐私,防止隐私数据泄露的安全风险。

2.2 权限管理

通过智能合约,可以为某个数据制定一定的规则,可实现在无第三方中心化节点控制的情况下,控制数据的访问权限,只有业务相关参与方才能读取或调用共享数据的信息,隔离非共享数据的参与方,强化了敏感数据共享的隐私与安全性。

2.3 隐私数据保护

利用区块链特性,增加对敏感数据的管理能力,提供更为安全与隐私的数据共享方式。基于区块链的可信数据交换使用一种隐私计算模型,数据共享方本地执行特定计算获取到计算结果,实现原始数据不出本地数据库,各方数据经过模型处理后的中间数据将由区块链汇总,并得到最后的计算结果,通过此方案减少数据暴露的风险,防止共享数据被倒卖或滥用,保护共享方的数据所有权。

2.4 数据分权管理

在政务、医疗、征信等多个领域都存在数据共享和交换的需求,当前的技术手段和隐私保护条款使得数据共享举步维艰。通过改进的加密算法加密隐私数据,保障共享方隐私数据的所属权;结合区块链智能合约技术处理隐私数据,密文结果送至使用方,数据用后即焚,做到数据不保存、不备份,实现数据所有权、执行权和使用权的解耦合分离,解决“谁的数据”“谁处理数据”“谁使用数据”等数据安全隐私问题。

3 区块链可信数据交换关键技术

可信数据交换技术借助区块链这一去中心化信任体系[6],利用链上数据不可篡改性、可追溯性和安全性等特性,同时结合智能合约技术和密码学技术,提供数据交换的隐私保护、归属权确认、权限管理和数据定责等功能。以图1所示的基于区块链的可信数据交换流程为例,首先考虑区块存储容量的局限性,数据拥有方仅公布数据目录到区块链,并将数据发布记录存储在区块中,以作溯源和存证之证据;其次,一个来自使用方A的业务请求R,通过HTTP请求访问区块链网络,共享方B收到请求R后,与使用方A签订智能合约,约定数据处理规则并协商同态加密密钥后,将原数据M={m1,m2,…,mn }加密并签名发送上链;密文数据C={c1,c2,…,cn }经合约处理得到密文结果c,智能合约将密文结果c返回给使用方A的同时,销毁链上数据。在整个数据交换过程中,通过同态加密方式使数据无需解密仍可进行分析和运算操作,不暴露原数据M,保障共享方的数据所有权。智能合约去中心化处理数据,掌握数据执行权,控制加密数据的访问和执行权限,加密数据用后置空销毁,使用方只有密文结果的使用权,互相监督,互相制约,实现数据权的分离解耦。

图1 区块链可信数据交换流程

隐私计算这一概念最早于2016年提出,是当前密码学领域中的前沿发展技术,旨在不泄露敏感数据的条件下,与其他节点合作计算并得到正确的结果,解决不安全环境中隐私数据泄露的痛点问题,但无法有效保证各方诚信。区块链打造了去中心化系统中的可信记账体系,可以有效解决信任问题,但其却有链上数据隐私性无法得到有效保护的难题。区块链和隐私计算具有天然的互补优势,将二者结合,使隐私数据上链成为可能,并可通过区块链验证真实性。基于区块链的可信数据交换技术,主要应用了两种核心技术。

3.1 同态加密技术

该技术是在数据可信交换时,实现隐私数据不出库、不泄密的情况下,满足数据查询方查询结果的需求。可将隐私数据加密成密文,通过智能合约处理密文数据并得到正确的密文结果,供使用方解密使用,用来确保隐私数据的归属权和隐私权。同态加密的主要思想是:假设明文M 对应的密文为M^",密文M^"通过计算操作得到密文结果C^",C^"解密后的数据D^"与明文M直接进行计算所得结果D相同,可实现隐私数据加密状态下的数据分析和处理,保护敏感数据安全。例如,Paillier同态加密算法,实现x(x取1 234)与y(y取5 678)的隐私计算,规定E为加密操作,D为解密操作,F为特定的计算操作。首先,选取符合条件的两个大素数生成同态加密公私钥,加密得到E(x)和E(y),计算D(F(E(x),E(y) )),结果如图2所示。

图2 同态加密隐私计算

3.2 非对称加密技术

该技术主要应用于区块链网络中的账户生成和交易签名等方面,不同于对称加密技术中使用同一密钥易泄密的缺陷,非对称加密只需公开公钥〚Key〛_pub,私钥〚Key〛_pri个人保存不公开,二者作用可简述为公钥加密、私钥解密、私钥签名、公钥验证。数字签名就是基于非对称加密技术的这一特性,通过数字签名,在区块链等去中心网络中,可以校验交易合法性,验证数据来源和校验数据完整性,防止数据伪造和篡改。

以中国电信股份有限公司北京研究院自研的区块链底层基础设施平台ctchain为例,用户0x96c851d07c51fc93a654c630e74 2164165a1dd3d 构造一笔普通的交易后,通过私钥对该笔交易签名,并发布交易到区块链网络中,其他节点可根据公钥验证该交易的合法性,成功发布的交易信息如图3所示。

图3 合法交易信息

4 基于区块链可信数据交换的投票应用

以政府政务系统中的人大代表选举为例,基于区块链底层平台ctchain搭建区块链可信数据交换平台,实现隐私数据保护、权限控制、数据分权和隐私计算等功能,全局业务框架如图4所示。

图4 全局业务框架

假设10个投票者(Voter)从3个候选人(Candidate)中选举代表,投票数如表1所示。

表1 票数分配

4.1 准备阶段

发起节点、发起投票合约vote. sol,公布候选人和同态加密公钥到区块链去中心网络,并将私钥存入排序节点(Order)。同时,CA认证节点根据投票节点的身份证Hash值验证其是否合法(是或否),认证通过的投票节点会被随机分配账户并绑定身份证Hash值。

4.2 投票阶段

合法投票节点将分配好的选举票数经同态加密后发布票数密文上链,可通过智能合约判断该Hash值是否已投票,防止刷票行为和非法节点投票。一方面基于Hash算法的不可逆性,只知道投票节点是经过认证的合法投票者,却不泄露投票节点的实际身份,可保护投票节点的个人隐私;另一方面,鉴于每次同态加密都会选择一个随机的参数值,因此即使被加密数据都为0,加密后的密文也是不相同的,实现秘密投票。部分密文数据如表2所示。可以看出,Voter1对Candidate2和Condidate3都投零票,但是票数的加密密文是不相同的,而且无任何映射关系。

表2 Voter1的投票密文

4.3 计票阶段

各投票节点可从链上获取并统计每个候选人各自的票数密文,可经排序节点,得到候选人票数密文由高到底的排序结果(见图5)。同时,可提示是否有相同最高票数候选人,若有票数相同者,可从这几人中再次进行选举。整个选举过程中,无论是投票人的投票信息,还是候选人的所得票数,都是以密文形式存在,通过隐私计算获取期望结果,实现可信数据交换。此外,选举发起单位也无法修改统计结果,保障票数可信不可篡改。

图5 密文票数排序结果

从图5可以看出,本例基于区块链的可信数据交换在保障选票数保密性和投票人身份隐私的前提下,将所需结果正确地反馈到区块链网络中的每个节点,具有良好的可信性和安全性,亦可为提案表决、电子招投标等应用场景提供一种良好的解决方案。

5 结束语

随着互联网的不断发展,通过有效的手段打破各数据源的数据孤岛壁垒,使数据流动并发挥价值,已成为各行各业在大数据时代下的共同诉求。基于区块链的可信数据交换技术,能够在保护数据隐私性的情况下,实现各节点间的数据交换和流通,使区块链成为推动数字经济架构转变的重要推手。基于区块链的可信数据交换系统主要包括数据目录管理、权限控制、隐私数据保护、数据权分离、隐私计算等功能。本文介绍了其应用到的关键技术,并提出了面向政务数据交换的场景和应用。随着区块链技术和加密学算法的不断发展完善,基于区块链的安全多方计算将成为解决数据共享交换的利刃,进一步解决隐私数据流通和应用中的痛点难点问题,成为数字社会改革和跨越式发展的重要推手。

参考文献

[1] 张繁, 蔡家楣. 电子政务系统中的数据交换和共享服务平台设计[J]. 计算机工程与应用, 2003, 39(7):226-229.

[2] 钱卫宁, 邵奇峰, 朱燕超, 等. 区块链与可信数据管理:问题与方法[J]. 软件学报, 2018,29(1):150-159.

[3] 贺海武, 延安, 陈泽华. 基于区块链的智能合约技术与应用综述[J]. 计算机研究与发展, 2018, 55(11):112-126.

[4] 宋颖杰. 非对称加密技术[J]. 信息网络安全, 2004(1):48-49.

[5] 袁勇, 王飞跃. 区块链技术发展现状与展望[J]. 自动化学报, 2016, 42(4):481-494.

[6] Chaum D, Javani F, Kate A, et al. cMix: Anonymization by high-performance scalable mixing [C]// USENIX Security, 2016.

A new method of trusted data exchange technology and

application based on blockchain

LIANG Wei1, ZHANG Zheng1, FENG Ming2, HE Zhiqiang2

(1. China TelecomResearch Institute, Beijing 102209, China;

2. China Telecom Corporation Technology Department, Beijing 100032, China)

Abstract: Trusted data exchange technology based on blockchain can achieve the protection and circulation of private data in a decentralized network, and promote the digital era to break the “information island” barriers. The background and requirements of trusted data exchange has been analyzed, elaborates common functions and key technologies in blockchain-based trusted data exchange, and demonstrates the application situation in conjunction with the blockchain infrastructure platform.

Key words: blockchain; data exchange; privacy computing

本文刊于《信息通信技术与政策》2020年第4期

声明:本文来自信息通信技术与政策,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。