Christian Graniou
欧洲经济区内数据分享和再利用的阻碍
文 / Catarina Arnaut, Marta Pont, Elizabeth Scaria, Arnaud Berghmans, Sophie Leconte
译 / 徐慧碧 殷忠鸿
本章介绍公司之间数据共享和重复使用的障碍。在本研究框架内得出的调查结果与通过对已经参与B2B数据共享的选定公司的访谈所收集的信息,以及在网络研讨会期间收集的见解均有一定的关系。这些研究结果旨深化先前第3章报告中的研究结果。
1. 数据共享的障碍
在调查取得回应的129家受访者中,有50家公司声称与其他公司分享数据。这占受访者总数的39%。在声称分享企业与企业关系数据的50家公司中,有52%报告在这样做时遇到了障碍,如下图所示。
图54. 参与B2B数据分享的公司及其所面临的障碍
根据调查结果,B2B数据共享的主要障碍包括技术障碍和相关成本(73%),以及有关“数据所有权”的法律不确定性(54%)。下图显示了参与调查的公司认为的相对重要的数据共享障碍。每家公司被允许指出最多四个障碍。
图55. 由调查结果所知的数据共享障碍
下面提供了公司之间数据共享障碍的详细分析。虽然调查结果显示了参与B2B数据共享的公司面临的主要障碍,但通过访谈和网络研讨会收集的见解将在下文中进行描述以补充这些发现。 这一分析也与以前研究中描述的信息进行了比较(见第3章)。
1.1. 技术障碍
技术障碍和相关成本是大部分参与B2B数据共享的公司面临的主要障碍(73%的受访者)。 作为案例研究的一部分,几家接受采访的公司也提到了这些障碍。 如下所述,它们分为不同的子类型。
TomTom指出,与数据备货有关的技术限制以及处理和保持最新大量数据以及由于能力有限而产生的相关成本所引起的数据共享的障碍,直到最近才出现。
缺乏数据标准化和互操作性也是空客、Enedis、geo、HERE、Telefónica和van den Borne所面临的重大挑战。这些公司面临着不同的数据格式和数据存储系统,这使得他们难以组合可用数据集并有效地提取他们的价值。这证实了最近一项研究的结果,[1]该研究发现互操作性标准缺乏是阻碍因素,或者是数据共享的一个非常重要或相当大的障碍。这一发现也证实了欧洲委员会关于欧洲数据经济的公众咨询收集的信息。[2]
在决定参与B2B数据共享之前,与存储相关的基础设施成本也是Orange的一个重要考虑因素,同时也是确保高安全标准的要求。最近的文献[3]支持这一发现,认为数据共享(也包括基础设施成本)的成本很重要,并且可能会影响数据供应商将数据集提供给其他人的决定。 就Orange而言,基于云平台的选择能够帮助他们通过获得按需使用付费解决方案来降低基础设施成本(而不必预先承担结构成本),同时保证数据安全性。与此同时,使用基于云的平台对他们来说是一个挑战,因为他们不熟悉这项技术。
在访谈期间或在网络研讨会上,进一步提到了数据质量差或不足是一些公司数据共享的障碍。例如,Enedis报告说,他们所持有的数据的粒度有时不符合数据用户的需求。由于后者要求更精细的粒度,Enedis不能确保足够的质量标准,因此决定不共享这些数据。
用于共享数据的平台架构的高度复杂性也可能构成障碍。正如Elering所提到的,他们平台的复杂架构可能会限制公司的充分开发,这些公司可能没有某些解决方案被所需的IT技能的。其正在开发用户手册,以克服这个障碍。
最后,一些公司指出缺乏与技术解决方案相关的信任这一障碍。这可能可以解释数据供应商不愿意分享数据的原因。例如,API-AGRO指出,一些数据供应商对不属于他们的服务器和平台的安全标准不信任。这就是为什么API-AGRO为数据供应商提供使用他们自己的API,直接从他们的服务器共享数据的原因。另一方面,Sensative AB认识到确保数据质量以在数据用户之间产生信任是至关重要的。然而实际上很难做到这一点便是数据共享的障碍。 因此,Sensative AB在其平台上建立了评估系统,以便数据用户可以评估所访问数据的质量。
1.2. 法律问题和相关关注
调查对象报告的数据共享的第二个主要障碍(54%)是关于“数据所有权”和/或数据集可以合法的做什么(即数据的使用)的法律不确定性。 与此同时,调查中也强调了追查和控制共享数据使用的困难(42%)。 这两个障碍也被公认为阻碍了一些受访公司的B2B数据共享,包括HERE、米其林、TomTom和van den Borne。虽然API-AGRO和Dawex不对通过其平台交换的数据拥有“所有权”,但他们还根据客户的经验和反馈意见提及这些障碍。这些发现再次与最近的文献相符。[4]
Elering、Enedis、MAN、Michelin和Orange还强调,除了对“数据所有权”的法律问题外,理解/或满足B2B数据共享中的数据保护的法律要求也存在困难。据受访者称,在可共享的数据类型方面仍存在一定程度的不确定性。与此同时,满足数据保护要求可能会导致公司产生确保匿名和汇总数据的额外成本。欧盟关于数据保护和隐私的新规则的特殊性和可能的限制缺乏知识和明确性,这也成为网络研讨会参与者分享数据的潜在法律障碍。
数据本地化限制也被确定为调查中的阻碍(27%)。最近的文献证实了第3章中讨论的这一发现[5] [6]。此外,TomTom特别报告了亚洲国家现有的监管限制,限制了其在这些市场收集和分享或出售地图数据的能力。
1.3. 缺乏能力
虽然公司内部缺乏熟练的数据工作者被强调为调查中数据共享的相关障碍(38%),但这一问题仅在一家受访公司受到关注。 Van den Borne指出,他们缺乏数据相关能力,从而导致操纵和理解他们在数据分享开始时的数据成为一项关键障碍。据受访者称,由于数据管理不善,内部缺乏数据技能会导致失去了两年的数据收集工作成果。基于与合作伙伴关系的几所大学一直在帮助Van den Borne吸引具有数据技能的学生来策划和分析他们掌握的数据。
1.4.其他数据分享障碍
由于数据不准确或误用以及难以找到合适的数据使用许可手段,公司对声誉成本的担忧是影响近五分之一的企业(19%)的障碍。此外,API-AGRO、空中客车公司Airbus和van den Borne提到了其他相关威胁,例如关于适用的合同许可合同的不确定性,或者为每个客户准备和定制许可协议的繁琐且成本高昂的过程。在最近进行的另一项研究[7]中,合同不确定性也被认为是数据共享的一个重要阻碍因素。
15%的被调查公司报告说,在共享数据造成损害的情况下,责任成本存在不确定性,这是数据共享的障碍。
访谈和网络研讨会都允许识别额外的障碍,其中包括:
有限的财力:企业需要获得持续的投资才能开展数据共享活动。正如Dawex和Orange所提到的,有限的财务资源可能成为扩大数据共享技术解决方案的障碍,或者难以使得投资营销在潜在数据用户中变得众所周知。
对数据潜力缺乏了解:数据用户似乎并不了解数据的潜力,除非他们看到数据集可以为他们的业务带来何种好处。这可以使数据货币化成为一项复杂的任务。Orange和Telefónica都花时间与数据用户交流,以展示数据如何帮助他们开发或改进产品或服务,或提高效率,从而创造更多收入。另一方面,Van den Borne正在编写一本手册,向数据用户解释如何使用每种数据集并应用于具体的使用案例。
2. 数据再利用障碍
在回答调查的129家公司中,有54家正在再利用其他公司的数据(42%)。在这54家公司中,有59%的公司报告存在再利用数据的障碍,如下图所示。
图56. 公司再利用数据并遇到障碍
下图总结了在调查中认为是数据用户的公司所面临的企业在企业关系中再利用数据的障碍。这些障碍的相对重要性也在图中基于报告它们的公司的数量来表示。公司被允许指出最多三个障碍。
图57. 由调查结果得知的数据再利用障碍
下面分析了公司之间数据重用的障碍。由于在本研究框架内进行的访谈仅侧重于B2B数据共享,因此相对于调查结果[8]中增加的见解较少。尽管如此,以下分析结果还包括以前研究中包含的信息(见第3章)。
2.1. 拒绝访问相关数据集
66%的被调查公司面临一个反复出现的障碍,即拒绝访问相关数据集。这项研究并没有试图弄清拒绝获取数据的原因。 某些数据供应商极有可能有正当理由拒绝访问他们的数据。此外,基于遵守相关法律或保护个人权利的原因,可能无法向其他方故意提供某些数据特征。例如,TomTom的许可协议限制访问驾驶者的实际速度数据。
2.2. 从其他公司获取数据的歧视和高昂成本情况
数据供应商施加的歧视条款或滥用条款以及访问数据的歧视性性价格成为平等基础上第二常见的障碍(41%)。van den Borne曾提到访问数据的歧视条款是整个农业部门的主要障碍。将设备出售给农民的大型设备制造商似乎在使用通过设备收集的数据方面强加自己的条件。这似乎限制了农民从这些机器产生的数据中产生价值的能力。在原始设备制造商方面(OEMs),汽车行业售后市场的公司的调查中也提出了对数量、质量、格式、成本或有关数据再利用的合同条件等歧视类型的担忧。
以前的研究通过提及数据供应商对数据访问的条件和限制[9]导致的不平等议价能力和滥用支配地位来证实这些发现。在访谈期间或在网络研讨会期间,未明确提出访问数据的歧视价格作为数据再利用的障碍。然而,之前的文献也将价格过高视为数据用户面临的障碍。[10]
2.3. 缺乏互操作性和标准化
一些公司声称在以所需格式访问数据方面遇到问题,因为这是调查中数据重复使用的障碍(31%)。像空客这样的公司在案例研究中也提到了内部产生的数据以及购买他们飞机的航空公司提供给他们的数据方面的互操作性问题。 HERE提到缺乏数据标准化是数据重复使用的一个重要障碍。 据该公司称,缺乏数据标准化特别会导致数据用户的高昂成本费用。 事实上,这支持最近文献的发现,这些文献指出互操作性和标准的建立是有效数据交换和低成本[11]发生的关键先决条件。
2.4. 数据再利用的其他障碍
数据本地化措施和数据供应商无法预料的数据访问终止被认为是数据重复使用的最不显著的障碍(分别有22%和13%的公司声称在调查中重复使用数据)。
除了调查中提出的障碍和上面讨论的其他障碍之外,数据用户缺乏足够的数据技能被强调为数据重用的潜在威胁。 API-AGRO(充当数据共享中介机构)提到了这一障碍,Elering也提到了这一障碍,特别是在使用其复杂的数据平台方面。
参考文献
[1] Deloitte and Openforum Europe, op.cit., pp. 40-41 and 50.
[2] European Commission (2017), “Annex to the Synopsis report: Detailed analysis of the public online
consultation results on Building a European Data Economy”, op.cit., p.42.
[3] Ibid., p. 15.
[4] Deloitte and Openforum Europe, op.cit., pp. 15 and 40.
[5] European Commission (2017), “Annex to the Synopsis report: Detailed analysis of the public online
consultation results on Building a European Data Economy”, op.cit., p.3.
[6] BusinessEurope and Noerr, op.cit., p. 14.
[7] Ibid., p. 15 and 40.
[8] 虽然案例研究和网络研讨会的重点都集中在数据共享的供应方面,但讨论中也出现了一些关于需求方面(即数据用户)面临的障碍的评论。 这要么是因为几个共享数据的公司同时重新使用其他人提供的数据,或者是作为数据共享中介或推动者采访的一些公司的性质,这使得他们处于 了解他们平台用户面临的障碍的好位置。
[9] Deloitte and Openforum Europe, op.cit., p.7 and “Annex to the synopsis report”, op. cit., p. 13.
[10] “Annex to the synopsis report”, Ibid.
[11] Ibid., p.94.
本文仅作学习交流之用
声明:本文来自大数据和人工智能法律研究院,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。