今天和大家分享的是田申的文章。田申为某集团数据合规负责人 上海交通大学凯原法学院兼职硕士生导师。

本文的写作得到了其所在服务集团隐私安全研究、研发业务中台@吴烨@朱逸@吴博峰@谭卓@张尧以及数据法务@张吉@高震同学的支持。

摘要:

隐私计算技术的应用,将在数据流动规则与数据(个人信息)保护规则之间发挥不可替代的桥梁作用,为“基于发展的流动规则”与“基于安全的保护规则”两套规则体系提供“衔接规则”,以在相当程度上缓解二者之间的紧张关系。保护计算技术对于数据法律规则的支撑,我们在2022年发布的《隐私计算法律适用规则报告》中进行了详细阐述。在此基础上,结合这两年来的实践和思考,我们对隐私计算在数据要素流动规则构建中的作用有了进一步认识:“数据流动的核心问题是【数据合法的再利用】,隐私计算是解决这个问题的关键”。

基于这一判断,我们认为,隐私计算对数据要素规则构建的协同作用,可以基于三个层面:第一层:基础层:解决数据要素的控制权与可再用性;第二层:协调层:解决数据流动与保护之间的关系;第三层:生态层:解决保障数字经济健康发展的各种衍生规则的合理构建。

一、解决数据在流动过程中的“控制权”难题

  • 我们并不否认数据确权在构建数据要素流动基础规则中的重要作用,但是当前首要解决的应该是一个“事实问题”,即:如何保障数据持有者对其数据在流动过程中的“控制权”问题。

  • 我们做出这一判断,是基于这样一个底层逻辑,即:数据的本质是信息的承载。一方面,信息的天然属性决定了数据具有高可复制性和易流转性,一旦进入流通环节,很难对其进行有效的控制。另一方面,信息的价值随着传播具有递弱效应,传递次数越多,范围越广,价值耗损就越大,最终趋近于零。因此,保障和促进数据要素流动的第一要务,不是“确权”,而是保障数据要素的“可再用性价值”,避免数据要素价值的减损。

  • 在具备数据交易的意愿和需求的同时,相关数据控者也存在对数据控制权丧失对担忧。在产业实践中,被投入到交易环节中的数据要素,并不是直接从提供服务过程中收集的原始数据,而更多是经过加工、处理、分析而汇集的精加工数据。我们可以将其看作是一种智力成果的体现,具有衍生价值。这些数据以服务或产品的形式出现,是经营者在经济活动中的获得经济利益和竞争优势的重要资产。如果这些数据在为其他需求方提供风控服务的过程中直接获取,也是对其商业资产价值和核心竞争力的减损。

  • 在交易过程中确保数据要素不因提供、共享、融合而泄露或不受控制的传播,是保障数据要素有序流动的基础。否则无论我们如何设置数据要素的“所有权”,都难以保障数据控制者在期间的正当权益。由此,在数据要素流动规则的构建中,将重点从“所有权”的确权,转向“控制权”的保障,避免数据资产在流转、共融过程中的价值流失是关键中的关键。对数据要素“控制权”的保护,实际上是落实对数字技术或者数字服务价值的保护。

二、发挥数据保护与数据流动两套法律机制之间的协调作用

数据流动要解决的核心问题是:数据的合法再利用,即:对提供服务过程中获取的数据,在其他场景中的合法再利用。这种合法再利用一般通过三个方式来解决:授权、目的兼容以及目的限定。但是在当前满足这三个方式却存在不小的困难:首先,难以获取用户的有效授权。其次,难以满足与提供服务的数据处理目的一致性。最后,数据共享后后续处理目的不可控。

隐私计算技术的应用可以在较大程度上缓解数据流动环节中的合规难点。这主要是通过隐私求交、阶段化匿名、数据处理目标对齐等措施实现:第一,隐私求交与匿踪查询:在数据持有方之间,通过PSI隐私求交集技术,使各方仅可获得共同所需数据集合,并且辅以匿踪查询等技术措施,保护查询主键(key),确保数据持有方无法知悉数据需求方查询信息内容。第二,阶段化匿名:利用多方安全计算技术,解决处理信息“属性”的合规,在特定的处理阶段中,使所处理的数据不属于个人信息。如果后续处理涉及为第三方服务的,则可以在新的服务场景中重新获取具体授权。第三,数据处理目标对齐:利用联邦学习技术,可以确保数据处理目的被限定在各方约定的梯度参数之中,即使梯度数据被转移至第三方,也无法被滥用。

三、助力构建基于风险的数字经济规则体系

  • 数字经济的发展离不开良好的规则体系。这套体系不仅需要构建“流动秩序”,也要关注“生态秩序”。前者解决什么类型的数据应该以什么样的方式流动,构建数据流动环节中的规则以及权利义务;后者解决在数字产业中,对于黑灰产等扰乱市场秩序,侵害市场主体利益的行为,应以何种方式进行对应,以避免在应对过程中损害用户的合法利益。简而言之,就是需要基于风险平衡的角度,构建数据处理与法益保护之间的协同规则,以促进数字市场的信任关系构建。

  • 在“流动秩序”规则中,对于高敏感数据是否可以进入流通环节,如何进入流通环节,以何种安全措施保障保障进入流通环节的敏感数据,都是需要回答的重要问题。例如,准备训练一款针对以医疗领域的大模型,需要大量医疗患者的数据和信息,这就需要在多家医疗机构之间共享数据。在这个大背景下,可以使用联邦学习、同态加密、秘密分享等相互结合隐私保护技术,构建数据本地不动的大规模语言模型的训练架构与方法,解决分布式的大模型训练问题。

  • 高敏感数据可以在隐私计算技术的加持下,可以相对安全的进入流通领域,以追求更高价值利益实现或法益保护。在此基础上,对于数字要素的流通则可以通过相对“量化”的形式进行构建,例如,对于数据敏感程度进行分级,根据不同敏感程度和应用场景,确定使用不同的隐私计算的技术路线。换言之,不是所有的隐私保护技术都适用于大模型训练场景,要通过风险等级识别以适配不同的解决路径。

构建健康的数字经济“生态秩序”,往往离不开基于数据的风险控制措施,而此类措施与用户的个人信息的处理息息相关,最终的评判结果也可能与用户个人利益密切相关。虽然法律对相关风控措施并未采取否定态度,在金融等高风险场景下,还规定了经营者相关的安全保障义务,但是采取何种风控措施以及采取何种程度的措施用于防控目的,都是模糊的边界。虽然在成文法体系下,法律规则通常不会就具体的价值判断给出明确边界,但是在面对日益价值多元与利益碰撞的数字经济中,可以适当引入普通法的思维,通过场景归纳的方式给出风险控制平衡的判断方法。在构建判断平衡方法的过程中,隐私计算技术的应用应当成为重要的考量因素。

•我们可以在数据要素流动构建基于风险构建安全保障的平衡规则的同时,基于场景制定相应的交易目的合规规则,例如在医疗领域,制定或适配相关医学伦理规则,以确保数据训练目的的正当性、合法性;在金融数据聚合的场景下,平衡用户与金融风控的“正当利益”,以保障控制系统性金融风险的基本要求,和防止金融消费者的利益不被侵害的诉求。

四、结语

当今技术进步对于法律规则的构建影响可能超越了以往任何一个时期。法律固然要发挥社会秩序“稳定器”与利益平衡“调节器”的作用,但这不能成为因循守旧的借口。法律应在时代的变革中紧跟科技革命的步伐,去找到相对合理的方式调整、引导这个变革时代的社会关系。“法律不是嘲讽的对象”。因为她凝聚着社会的共识,因为她捍卫着社会的秩序与人类的良知底线,因为她要避免“人们因良善目的而通向地狱之路”。在人类社会进入工业文明以来,又迎来三百年未有之变局,而在这时代的关口中,我们这批数据法律人,能植根科技产业,站在技术创新的前沿,与交叉学科的各类人才协作,努力从技术规范中归纳梳理相应的法律规则,这无疑是一件幸运和令人激动人心的事情。

声明:本文来自网安寻路人,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。