世界经济论坛(WEF)2021年8月发布白皮书《面向数据经济的数据交换框架》(后台回复“数据经济”下载原版报告)。该白皮书由印度第四次工业革命中心主导,是世界经济论坛数据通用计划(DCPI)的一部分,旨在阐明数据交换(DEx)作为一种数据共享机制如何能够负责任地发挥关键作用,释放数据经济的潜力。
作者 | 贺佳瀛/赛博研究院研究员
来源 | 世界经济论坛
白皮书主要内容:
(1)规定了DEx功能能力的参考模型,该五层式数据交换生态系统包括数据层、同意层、数据供应层、交换层和消费层,其中核心层——数据交换是基于一组技术和治理原则,促进数据提供者和消费者之间在可信、合法合规的环境中交换数据;
(2)平衡创新与监管需求的数据治理要求;
(3)激励数据共享的方法,确保其处于可自我维持的模式;
(4)五个促进DEx的使能因素。
一、发展数据经济成为当务之急
1、数字生态系统和数据生态系统
数字生态系统。在印度,基于国家开放数字生态系统(NODE)和印度企业架构(IndEA)的数字生态系统正在兴起,这两项举措均由印度政府(GoI)电子和信息技术部推动。卫生和家庭福利部制定了国家数字健康使命(NDHM),旨在创建国家数字健康生态系统。此外,在农业(IDEA——印度农业数字生态系统)、金融(UPI——统一支付接口)、教育(NDEAR——国家数字教育架构)和智慧城市(智慧城市使命)等领域也正在形成数字生态系统。数字生态系统的演进是数据经济实现系统有机增长的关键要素之一。
数据生态系统。数据生态系统是更为综合的数字生态系统的子元素,包含数据和相关标准——除了与其他数字生态系统交互的协议外,还包括数据集、应用程序、服务和支付机制的创建和互操作性标准。数据生态系统覆盖公共和私营部门,包含数据价值链的端到端视图,有望在印度数据经济的快速发展中发挥关键作用。
2、实现数据经济的障碍
数据的不可用性。只有当数据可用时,数据经济的潜力才能实现。数据的可用性和可获得性仍然构成挑战。除政府外,如今所产生的大部分数据仍在私营部门,孤立且无法用于共同目的。
可用数据质量低。即使数据集可用,但若其不完整、标签错误或以非结构化形式存在,则需要大量工作来进行数据清洗或数字化,以获得潜在或预期价值。
数据集缺乏互操作性。在需要共享/分析/整合不同来源的数据时,缺乏统一的标准和协议成为挖掘数据意义的障碍。例如,在医疗保健领域,不同的医疗服务提供者可能会以不同的格式进行健康记录,使数据的可移植性变得非常困难。
数据保护和隐私存在监管不确定性。与数据隐私有关的法律在不断发展。数据所有权相关问题,以及遵守数据保护法的难易程度阻碍了有效的数据共享。
3、数据交换以实现数据经济
数据交换(DEx)是进行数据无缝交换、实现数据价值的机制。在数据交换中,企业、政府和公民/居民将有机会为特定目的获取数据。与此同时,必须确保所有利益相关者和参与者的权利得到承认和保护。数据应以可信、安全和高效的方式进行交换,而不应被滥用。在实现共同目的、释放数据价值方面,DEx具有如下好处:
加强数据可发现性。DEx平台促进了数据的可发现性。在单一平台上,多个数据提供者可与多个数据用户共享数据集的访问机制,确定并实施互利的数据共享交易。如果没有这样的平台,双边交易可能面临高成本和低效率。
释放数据的组合力量。若能及时便利地获取正确数据集,可通过利用多源数据集的组合力量,为受益人提供增值、综合和端到端的服务。
增加数据可用性。有关可信来源、高质量的数据集需求,将使数据提供者加强数据质量,从而创造数据可用性和使用的良性循环。
加强数据规则。市场动态提出的严格的质量要求将使各利益相关者在参与过程中加强数据规则,并在DEx生态系统中获益。
提升透明度。通过数据分析和深入了解各个实体的运作和绩效,公共和私营部门将提升透明度。
加快相关研究。公共利益领域的研究,如健康、教育、农业和环境等将得到加快。
4、由数据经济驱动的行业转变
二、数据交换的功能结构
1、DEx设计的技术和管理原则
1)技术原则
基础能力和核心部件具有正交性(orthogonality),意味着两者可以独立发展 所用技术具有可扩展性(extensibility),可在不牺牲互操作性的情况下进行演变;
以开放标准和开放的应用程序接口(API)为基础的生态系统,作为数据交换的基础;
具有互操作性(interoperability),保障数据流动;
采取联合架构以确保DEx的运作具有自主性和分散性;
确保数据不可知,保持数据交换的中立性。
2)治理原则
数据交换中利益相关者、系统和交易之间构建信任;
平等和无歧视地进行数据交换,确保获得数据的民主化;
在数据交换利益相关者之间公平地分配风险和回报;
数据交换业务的透明度;
采取设计即隐私和设计即安全,确保数据交换安全且受保护;
建立问责制和治理机制,为利益相关者提供适当的补救措施。
2、DEx生态系统层的能力和功能
DEx生态系统被概念化为五层:数据、同意、数据供应、交换和消费。每一层的能力和功能如下:
数据层指数据所有者/提供者所持有的数据;
同意层支持同意管理,遵守数据提供者/所有者规定的共享目的以及适当的技术法律解决方案进行验证;
供应层在必要时通过各种方法丰富数据,例如聚合、注释、元数据创建、标记、编目和匿名化等;
交换层在“DEx的参考模型”中详细说明;
消费层指数据消费者使用数据,出于共同目的实现数据经济价值。
DEx的参考模型
DEx生态系统的核心是“交换”层。下图提供了一个DEx参考模型,主要包括六项功能:
1)身份管理:DEx能够识别、认证和授权打算在平台上交易的数据提供者和消费者。对平台的信任与DEx执行这三个功能(身份识别、身份认证和授权)的严格程度有关。
2)数据集发现和质量管理:DEx不存储数据,但促进数据提供者和数据消费者之间的点对点数据交换。各种数据集应按逻辑结构或分类法进行组织,帮助数据消费者轻松搜索相关交易并找到所寻内容。样本数据集还可以在受控环境中提供实时测试功能。解决方案可以建立在开源和专有软件之上。
3)DEx网关:DEx网关促进数据提供者和消费者之间数据集的安全交换。该层为集成平台即服务和API管理的服务提供商提供了机会。
4)交易管理:交易管理系统应该简单,尽可能减少步骤,直观并顺畅。流程应该是安全的,防止欺诈交易。
5)信任管理:除其他功能外,不可篡改的审计跟踪和数据来源认证将增加平台信任。部署分布式账本技术(DLT)是可行的选择。评级和审核机制有助于吸引更多消费者使用,确定最受欢迎和最值得信赖的数据集。
6)基础设施和支持服务:各种基础设施和支持服务,包括但不限于有效的申诉补救系统,增强透明度和用户信心。
三、数据交换治理
1、DEx利益相关者
2、数据交换生态系统治理框架的3P方法
在当前治理框架的基础上,报告建议采用3P方法——保护(protect)、预防(prevent)、促进(promote)——进行治理。该框架的核心目标是保护个人数据、设计即隐私、数据权利管理、防止反竞争实践和滥用数据以及促进标准和协议的创新和发展。
1)保护(Protect)
个人和非个人数据
生态系统中的所有利益相关者都应在整个数据价值链中保护自然人的个人可识别信息(PII)。在所有数字和数据生态系统的设计和实施中,特别是处理个人数据的生态系统,都应遵守设计即隐私的原则。这些包括但不限于通知、选择、同意、目的限制、收集限制、披露限制、数据所有者访问和更正的权利、安全性、问责制和透明度。
嵌入数据权限管理
可采用数据使用的差异授权,让数据所有者/提供者指定其数据可用于哪些目的、持续时间以及是否应将数据货币化。为了实现该要求,可以开发数据权限管理框架,类似于媒体和娱乐领域的数字权限管理。
有效的申诉处理机制
应通过适当的申诉纠正机制保护所有数据利益相关者的利益。
2)预防(Prevent)
未经授权使用和滥用数据
可以通过确定和商定数据共享的目的,防止可能的数据滥用。通过适用于所有DEx或专门适用于具体经济领域或部门的适当标准和指南来定义数据处理目的类别。相关例子是国际标准化组织(ISO)制定的标准14265-1130,关于使用健康数据的“目的分类”。相关框架的设计不应阻碍创新,最好在处理非个人数据方面采取自我监管的形式。
反竞争实践
相关框架的设计应考虑到数据特征,使其更遵循反竞争实践。可以针对部分做法提供报告规范,相关做法明显倾向于形成垄断,以及倾向于通过规模壁垒、专有技术以及对高计算/存储容量的要求来阻止新进入者。
对利益相关者的危害
可以建立认证机制来确保需要使用各种数据集的应用程序是真实的并且可以被用户信任。
3)促进(Promote)
一个动态的、有竞争力的、值得信赖的DEx生态系统
– 可能会开发用于数据生态系统利益相关者和参与者注册/取消注册/退出的轻量级流程,具体取决于使用数据的部门和目的;
– 可以制定与数据的敏感性和内在价值相称、适当的报告和合规机制;
– 在合理限制下,可以鼓励数据业务实体和DEx生态系统中的各服务提供商之间实现数据可移植性。
制定标准和协议,应鼓励治理机构:
– 开发并支持采用标准和协议,实现互操作性、智能合约和数据集的发现;
– 开发开源工具和技术,使DEx生态系统能够轻松扩展。
开放式创新
– 促进数据获取的便利性,用于创新和研究;
– 确保公平访问数据,特别是对于初创企业和中小型企业;
– 确保访问、使用和评估数据的公平、合理和非歧视性(FRAND)条款;
– 促进可以跨参与者、部门和行业的伙伴关系。
四、激励数据共享
1、影响数据价值确定的因素
2、激励数据共享
1)政策和监管框架
根据数据集的重要性及其在特定部门中的使用,在某些情况下,政府可促进公共和私营部门的数据共享。例如,芬兰于2018年生效的《运输服务法》规定开放运输部门的某些基本数据,以全面审查运输部门。
2)货币激励
数据通常被视为一种商品,因此存在允许买卖数据集的私有数据市场/交易所。在这种情况下,数据集可产生直接收入,这也将建立客观的估值方法和对高质量可信数据集的需求。
3)非货币激励
互惠互利:可以激励数据提供者共享数据以换取访问其他提供者的数据。例如,疫苗冷藏供应商和运输公司将通过DEx共享数据来追踪疫苗,从而实现互惠互利。
创新机会:某些企业倾向于通过黑客马拉松/挑战等方式以提供数据集创新的机会。其受益于获得对现有数据集的见解或解决特定问题。
数据信用:出于共同目的的数据共享可以被视为企业社会责任计划的一部分,因为它可以为社会带来重大利益。可以为公司提供数据信用,类似于碳信用。这不仅会激励企业将数据用于共同目的,还可以将其作为环境、社会和治理(ESG)合规性的衡量标准。
五、数据交换生态系统的推动因素
数据交换作为一种从数据中获取价值的共享机制尚处于起步阶段。各DEx模型——包括不同领域的公共、私人和公私合作伙伴关系——正在全国和全球范围内进行测试。DEx发展的关键推动因素:
1)数据的可获得性;
2)数据的可用性,满足数据用户的特定或一般要求。数据的可用性取决于:可发现性、实用性、基于标准、隐私保护、基于同意、授权访问;
3)DEx利益相关者之间的信任环境;
4)促进DEx采用和发展的协作和多方参与的方法;
5)有效的治理体系,保护利益相关者和社会的利益,促进去中心化数据交易的发展。
声明:本文来自赛博研究院,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。